Подключение Superset к ClickHouse
Apache Superset - это платформа для исследования и визуализации данных с открытым исходным кодом, написанная на Python. Superset подключается к ClickHouse с помощью Python-драйвера, предоставленного ClickHouse. Давайте посмотрим, как это работает...
Цель
В этом руководстве вы создадите панель мониторинга в Superset с данными из базы данных ClickHouse. Панель мониторинга будет выглядеть так:

Если у вас нет набора данных для работы, вы можете добавить один из примеров. В этом руководстве используется набор данных UK Price Paid, поэтому вы можете выбрать его. В той же категории документации есть несколько других наборов данных на выбор.
1. Соберите ваши данные для подключения
Чтобы подключиться к ClickHouse с помощью HTTP(S), вам нужна следующая информация:
-
ХОСТ и ПОРТ: обычно порт 8443 при использовании TLS или 8123 при его отсутствии.
-
НАЗВАНИЕ БАЗЫ ДАННЫХ: по умолчанию есть база данных с именем
default
, используйте имя базы данных, к которой вы хотите подключиться. -
ИМЯ ПОЛЬЗОВАТЕЛЯ и ПАРОЛЬ: по умолчанию имя пользователя
default
. Используйте имя пользователя, подходящее для вашего случая использования.
Данные для вашей службы ClickHouse Cloud доступны в консоли ClickHouse Cloud. Выберите службу, к которой вы будете подключаться, и нажмите Подключиться:

Выберите HTTPS, и детали будут доступны в примере команды curl
.

Если вы используете self-managed ClickHouse, детали подключения задаются вашим администратором ClickHouse.
2. Установите драйвер
-
Superset использует драйвер
clickhouse-connect
для подключения к ClickHouse. Подробности оclickhouse-connect
можно найти по адресу https://pypi.org/project/clickhouse-connect/, и его можно установить с помощью следующей команды: -
Запустите (или перезапустите) Superset.
3. Подключите Superset к ClickHouse
- Внутри Superset выберите Data из верхнего меню, а затем Databases из выпадающего меню. Добавьте новую базу данных, нажав кнопку + Database:

- На первом шаге выберите ClickHouse Connect как тип базы данных:

- На втором шаге:
- Установите SSL в включенное или выключенное положение.
- Введите информацию о подключении, которую вы собрали ранее.
- Укажите DISPLAY NAME: это может быть любое имя, которое вам нравится. Если вы будете подключаться к нескольким базам данных ClickHouse, сделайте имя более описательным.

- Нажмите кнопки CONNECT, а затем FINISH, чтобы завершить мастер настройки, и вы должны увидеть вашу базу данных в списке баз данных.
4. Добавьте набор данных
-
Чтобы взаимодействовать с данными ClickHouse в Superset, вам нужно определить dataset. В верхнем меню Superset выберите Data, затем Datasets из выпадающего меню.
-
Нажмите кнопку для добавления набора данных. Выберите вашу новую базу данных в качестве источника данных, и вы должны увидеть таблицы, определенные в вашей базе данных:
- Нажмите кнопку ADD внизу диалогового окна, и ваша таблица появится в списке наборов данных. Вы готовы создать панель мониторинга и проанализировать ваши данные ClickHouse!
5. Создание диаграмм и панели мониторинга в Superset
Если вы знакомы с Superset, вам будет легко перейти к следующему разделу. Если вы новичок в Superset, что ж... это похоже на многие другие крутые инструменты визуализации, доступные в мире - на изучение интерфейса нужно немного времени, но детали и нюансы осваиваются постепенно с использованием инструмента.
- Вы начинаете с панели мониторинга. В верхнем меню Superset выберите Dashboards. Нажмите кнопку в правом верхнем углу, чтобы добавить новую панель мониторинга. Следующая панель мониторинга называется UK property prices:

- Чтобы создать новую диаграмму, выберите Charts из верхнего меню и нажмите кнопку для добавления новой диаграммы. Вам будет показано много вариантов. В следующем примере показан Круговой график с использованием набора данных uk_price_paid из выпадающего списка CHOOSE A DATASET:

- Круговые диаграммы Superset требуют Dimension и Metric, остальные параметры являются необязательными. Вы можете выбрать свои собственные поля для измерения и метрики, в этом примере используется поле ClickHouse
district
в качестве измерения иAVG(price)
в качестве метрики.


- Если вы предпочитаете кольцевые диаграммы вместо круговых, вы можете установить это и другие параметры в разделе CUSTOMIZE:

- Нажмите кнопку SAVE, чтобы сохранить диаграмму, затем выберите UK property prices в выпадающем меню ADD TO DASHBOARD, после чего SAVE & GO TO DASHBOARD сохранит диаграмму и добавит ее на панель мониторинга:

- Вот и всё. Создание панелей мониторинга в Superset на основе данных ClickHouse открывает целый мир молниеносной аналитики данных!
