Перейти к основному содержимому
Перейти к основному содержимому

Использование marimo с ClickHouse

Community Maintained

marimo — это открытый реактивный ноутбук для Python с встроенным SQL. Когда вы запускаете ячейку или взаимодействуете с элементом интерфейса, marimo автоматически выполняет затронутые ячейки (или помечает их как устаревшие), поддерживая согласованность кода и вывода и предотвращая ошибки до их появления. Каждый ноутбук marimo хранится в виде чистого Python, может выполняться как скрипт и развертываться как приложение.

1. Установка marimo с поддержкой SQL

Это должно открыть веб-браузер, работающий на localhost.

2. Подключение к ClickHouse.

Перейдите к панели источников данных на левой стороне редактора marimo и нажмите 'Добавить базу данных'.

Вам будет предложено заполнить данные о базе данных.

Затем у вас будет ячейка, которую можно запустить для установки соединения.

3. Выполнение SQL

После установки соединения вы можете создать новую SQL ячейку и выбрать движок clickhouse.

Для данного руководства мы будем использовать набор данных такси Нью-Йорка.

Теперь вы можете просмотреть результаты в DataFrame. Я хотел бы визуализировать самые дорогие высадки из заданного места посадки. marimo предоставляет несколько компонентов интерфейса для помощи в этом. Я буду использовать выпадающий список для выбора места и altair для построения графиков.

Реактивная модель выполнения marimo распространяется на SQL запросы, поэтому изменения в вашем SQL автоматически запускают вычисления для зависимых ячеек (или опционально помечают ячейки как устаревшие для ресурсоемких вычислений). Следовательно, график и таблица изменяются, когда запрос обновляется.

Вы также можете переключить режим App View для чистого интерфейса для исследования ваших данных.