Перейти к основному содержимому
Перейти к основному содержимому

Подключение Superset к ClickHouse

Apache Superset - это платформа для исследования и визуализации данных с открытым исходным кодом, написанная на Python. Superset подключается к ClickHouse с помощью Python-драйвера, предоставленного ClickHouse. Давайте посмотрим, как это работает...

Цель

В этом руководстве вы создадите панель мониторинга в Superset с данными из базы данных ClickHouse. Панель мониторинга будет выглядеть так:

Новая панель мониторинга
Добавьте некоторые данные

Если у вас нет набора данных для работы, вы можете добавить один из примеров. В этом руководстве используется набор данных UK Price Paid, поэтому вы можете выбрать его. В той же категории документации есть несколько других наборов данных на выбор.

1. Соберите ваши данные для подключения

Чтобы подключиться к ClickHouse с помощью HTTP(S), вам нужна следующая информация:

  • ХОСТ и ПОРТ: обычно порт 8443 при использовании TLS или 8123 при его отсутствии.

  • НАЗВАНИЕ БАЗЫ ДАННЫХ: по умолчанию есть база данных с именем default, используйте имя базы данных, к которой вы хотите подключиться.

  • ИМЯ ПОЛЬЗОВАТЕЛЯ и ПАРОЛЬ: по умолчанию имя пользователя default. Используйте имя пользователя, подходящее для вашего случая использования.

Данные для вашей службы ClickHouse Cloud доступны в консоли ClickHouse Cloud. Выберите службу, к которой вы будете подключаться, и нажмите Подключиться:

Кнопка подключения к службе ClickHouse Cloud

Выберите HTTPS, и детали будут доступны в примере команды curl.

Детали подключения ClickHouse Cloud через HTTPS

Если вы используете self-managed ClickHouse, детали подключения задаются вашим администратором ClickHouse.

2. Установите драйвер

  1. Superset использует драйвер clickhouse-connect для подключения к ClickHouse. Подробности о clickhouse-connect можно найти по адресу https://pypi.org/project/clickhouse-connect/, и его можно установить с помощью следующей команды:

  2. Запустите (или перезапустите) Superset.

3. Подключите Superset к ClickHouse

  1. Внутри Superset выберите Data из верхнего меню, а затем Databases из выпадающего меню. Добавьте новую базу данных, нажав кнопку + Database:
Добавить новую базу данных
  1. На первом шаге выберите ClickHouse Connect как тип базы данных:
Выберите Clickhouse
  1. На втором шаге:
  • Установите SSL в включенное или выключенное положение.
  • Введите информацию о подключении, которую вы собрали ранее.
  • Укажите DISPLAY NAME: это может быть любое имя, которое вам нравится. Если вы будете подключаться к нескольким базам данных ClickHouse, сделайте имя более описательным.
Проверьте соединение
  1. Нажмите кнопки CONNECT, а затем FINISH, чтобы завершить мастер настройки, и вы должны увидеть вашу базу данных в списке баз данных.

4. Добавьте набор данных

  1. Чтобы взаимодействовать с данными ClickHouse в Superset, вам нужно определить dataset. В верхнем меню Superset выберите Data, затем Datasets из выпадающего меню.

  2. Нажмите кнопку для добавления набора данных. Выберите вашу новую базу данных в качестве источника данных, и вы должны увидеть таблицы, определенные в вашей базе данных:

Новый набор данных
  1. Нажмите кнопку ADD внизу диалогового окна, и ваша таблица появится в списке наборов данных. Вы готовы создать панель мониторинга и проанализировать ваши данные ClickHouse!

5. Создание диаграмм и панели мониторинга в Superset

Если вы знакомы с Superset, вам будет легко перейти к следующему разделу. Если вы новичок в Superset, что ж... это похоже на многие другие крутые инструменты визуализации, доступные в мире - на изучение интерфейса нужно немного времени, но детали и нюансы осваиваются постепенно с использованием инструмента.

  1. Вы начинаете с панели мониторинга. В верхнем меню Superset выберите Dashboards. Нажмите кнопку в правом верхнем углу, чтобы добавить новую панель мониторинга. Следующая панель мониторинга называется UK property prices:
Новая панель мониторинга
  1. Чтобы создать новую диаграмму, выберите Charts из верхнего меню и нажмите кнопку для добавления новой диаграммы. Вам будет показано много вариантов. В следующем примере показан Круговой график с использованием набора данных uk_price_paid из выпадающего списка CHOOSE A DATASET:
Новая диаграмма
  1. Круговые диаграммы Superset требуют Dimension и Metric, остальные параметры являются необязательными. Вы можете выбрать свои собственные поля для измерения и метрики, в этом примере используется поле ClickHouse district в качестве измерения и AVG(price) в качестве метрики.
Метрика SUM Метрика SUM
  1. Если вы предпочитаете кольцевые диаграммы вместо круговых, вы можете установить это и другие параметры в разделе CUSTOMIZE:
Добавить диаграмму на панель мониторинга
  1. Нажмите кнопку SAVE, чтобы сохранить диаграмму, затем выберите UK property prices в выпадающем меню ADD TO DASHBOARD, после чего SAVE & GO TO DASHBOARD сохранит диаграмму и добавит ее на панель мониторинга:
Добавить диаграмму на панель мониторинга
  1. Вот и всё. Создание панелей мониторинга в Superset на основе данных ClickHouse открывает целый мир молниеносной аналитики данных!
Новая панель мониторинга