Перейти к основному содержимому
Перейти к основному содержимому

Режимы развертывания

ClickHouse — это универсальная система баз данных, которую можно развернуть несколькими разными способами в зависимости от ваших потребностей. В своей основе все варианты развертывания используют один и тот же мощный движок базы данных ClickHouse — различия заключаются в том, как вы с ним взаимодействуете и где он работает.

Идет ли речь о крупномасштабной аналитике в производственной среде, локальном анализе данных или разработке приложений, для вашего варианта использования предусмотрен соответствующий вариант развертывания. Консистентность основного движка означает, что вы получаете такую же высокую производительность и совместимость с SQL во всех режимах развертывания. В этом руководстве рассматриваются четыре основных способа развертывания и использования ClickHouse:

  • ClickHouse Server для традиционных развертываний клиент/сервер
  • ClickHouse Cloud для полностью управляемых операций с базами данных
  • clickhouse-local для обработки данных с командной строки
  • chDB для встраивания ClickHouse непосредственно в приложения

Каждый режим развертывания имеет свои сильные стороны и идеальные варианты использования, которые мы рассмотрим подробнее ниже.

ClickHouse Server

ClickHouse Server представляет собой традиционную архитектуру клиент/сервер и идеально подходит для производственных развертываний. Этот режим развертывания обеспечивает полные возможности OLAP-базы данных с высокой пропускной способностью и низкой задержкой запросов, за которые ClickHouse известен.

ClickHouse Server

Когда дело доходит до гибкости развертывания, ClickHouse Server можно установить на вашем локальном компьютере для разработки или тестирования, развернуть на крупных облачных провайдерах, таких как AWS, GCP или Azure, для облачных операций или настроить на собственном серверном оборудовании. Для более масштабных операций его можно настроить в качестве распределенного кластера для обработки увеличенной нагрузки и обеспечения высокой доступности.

Этот режим развертывания является оптимальным выбором для производственных сред, где критически важны надежность, производительность и полный доступ к функциям.

ClickHouse Cloud

ClickHouse Cloud — это полностью управляемая версия ClickHouse, которая снимает операционные накладные расходы на выполнение собственного развертывания. Хотя она сохраняет все основные возможности ClickHouse Server, она улучшает работу с помощью дополнительных функций, предназначенных для оптимизации разработки и операций.

ClickHouse Cloud

Ключевое преимущество ClickHouse Cloud заключается в его интегрированных инструментах. ClickPipes предоставляет надежную инфраструктуру для загрузки данных, позволяя вам легко подключаться и передавать данные из различных источников без управления сложными ETL-каналами. Платформа также предлагает специализированный API запроса, что значительно упрощает создание приложений.

SQL Консоль в ClickHouse Cloud включает мощную функцию панелей мониторинга, позволяющую вам преобразовывать ваши запросы в интерактивные визуализации. Вы можете создавать и делиться панелями мониторинга, построенными на ваших сохраненных запросах, с возможностью добавления интерактивных элементов через параметры запросов. Эти панели могут быть динамическими с использованием глобальных фильтров, позволяя пользователям исследовать данные через настраиваемые представления — хотя важно отметить, что пользователи должны иметь хотя бы доступ на чтение к базовым сохраненным запросам, чтобы видеть визуализации.

Для мониторинга и оптимизации ClickHouse Cloud включает встроенные графики и инсайты по запросам. Эти инструменты предоставляют глубокую видимость в производительность вашего кластера, помогая вам понять шаблоны запросов, использование ресурсов и потенциальные возможности оптимизации. Такой уровень наблюдаемости особенно ценен для команд, которым необходимо поддерживать высокопроизводительные аналитические операции, не уделяя ресурсов управлению инфраструктурой.

Управляемая природа сервиса означает, что вам не нужно беспокоиться об обновлениях, резервных копиях, масштабировании или патчах безопасности — все это обрабатывается автоматически. Это делает ClickHouse Cloud идеальным выбором для организаций, которые хотят сосредоточиться на своих данных и приложениях, а не на администрировании баз данных.

clickhouse-local

clickhouse-local — это мощный инструмент командной строки, который предоставляет полную функциональность ClickHouse в виде самостоятельного исполняемого файла. Это по сути та же база данных, что и ClickHouse Server, но упакованная таким образом, что позволяет вам использовать все возможности ClickHouse напрямую с командной строки без запуска экземпляра сервера.

clickhouse-local

Этот инструмент отлично подходит для разового анализа данных, особенно при работе с локальными файлами или данными, хранящимися в облачных сервисах хранения. Вы можете напрямую запрашивать файлы в различных форматах (CSV, JSON, Parquet и т.д.) с использованием диалекта SQL ClickHouse, что делает его отличным выбором для быстрого анализа данных или единичных задач.

Так как clickhouse-local включает всю функциональность ClickHouse, вы можете использовать его для преобразования данных, конвертации форматов или любых других операций с базами данных, которые вы обычно выполняли бы с ClickHouse Server. Хотя в основном он используется для временных операций, он также может сохранять данные, используя тот же движок хранения, что и ClickHouse Server, если это необходимо.

Сочетание функций удаленных таблиц и доступ к локальной файловой системе делает clickhouse-local особенно полезным для сценариев, где вам нужно объединять данные между ClickHouse Server и файлами на вашем локальном компьютере. Это особенно ценно, когда вы работаете с конфиденциальными или временными локальными данными, которые не хотите загружать на сервер.

chDB

chDB — это ClickHouse, встраиваемый в качестве встроенного движка базы данных, при этом Python является основной реализацией, хотя он также доступен для Go, Rust, NodeJS и Bun. Этот вариант развертывания приносит мощные возможности OLAP ClickHouse непосредственно в процесс вашего приложения, устраняя необходимость в отдельной установке базы данных.

chDB - Embedded ClickHouse

chDB обеспечивает бесшовную интеграцию с экосистемой вашего приложения. Например, в Python он оптимизирован для эффективной работы с распространенными инструментами для анализа данных, такими как Pandas и Arrow, минимизируя накладные расходы на копирование данных через memoryview Python. Это особенно ценно для ученых и аналитиков данных, которые хотят использовать производительность запросов ClickHouse в своих существующих рабочих процессах.

chDB также может подключаться к базам данных, созданным с помощью clickhouse-local, обеспечивая гибкость в том, как вы работаете с вашими данными. Это означает, что вы можете без проблем переключаться между локальной разработкой, анализом данных в Python и более постоянными решениями для хранения, не изменяя свои шаблоны доступа к данным.