Быстрый старт
Обзор
Настройте ClickHouse быстро. Скачайте подходящий бинарный файл для вашей ОС, узнайте, как запустить сервер ClickHouse, создать таблицу, вставить в нее данные и выполнить запрос к вашей таблице с помощью клиента ClickHouse.
Предварительные требования
Вам потребуется curl или другой HTTP-клиент командной строки, чтобы скачать бинарный файл ClickHouse.
Скачайте бинарный файл
ClickHouse работает нативно на Linux, FreeBSD и macOS, а также работает на Windows через WSL. Самый простой способ скачать ClickHouse локально — запустить следующую команду curl
. Она определяет, поддерживается ли ваша операционная система, а затем скачивает соответствующий бинарный файл ClickHouse.
Рекомендуем выполнить команду ниже из новой и пустой подпапки, так как некоторые конфигурационные файлы будут созданы в директории, в которой находится бинарный файл при первом запуске сервера ClickHouse.
Вы должны увидеть:
На этом этапе вы можете проигнорировать подсказку о запуске команды install
.
Для пользователей Mac: Если вы получаете ошибки, что разработчик бинарного файла не может быть проверен, пожалуйста, смотрите "Исправление ошибки проверки разработчика в MacOS".
Запустите сервер
Запустите следующую команду, чтобы запустить сервер ClickHouse:
Вы должны увидеть, как терминал заполняется логами. Это ожидаемо. В ClickHouse уровень логирования по умолчанию установлен на trace
, а не на warning
.
Запустите клиент
Используйте clickhouse-client
, чтобы подключиться к вашему сервису ClickHouse. Откройте новый терминал, перейдите в директорию, где сохранен ваш бинарный файл clickhouse
, и выполните следующую команду:
Вы должны увидеть улыбающееся лицо, когда он подключается к вашему сервису, работающему на localhost:
Создайте таблицу
Используйте CREATE TABLE
, чтобы определить новую таблицу. Типичные команды SQL DDL работают в ClickHouse с одним дополнением — таблицы в ClickHouse требуют наличие параметра ENGINE
. Используйте MergeTree
, чтобы воспользоваться преимуществами производительности ClickHouse:
Вставьте данные
Вы можете использовать знакомую команду INSERT INTO TABLE
с ClickHouse, но важно понимать, что каждое вставление в таблицу MergeTree
вызывает создание того, что мы называем part в ClickHouse, в хранилище. Эти части позже объединяются в фоновом режиме ClickHouse.
В ClickHouse мы стремимся выполнять массовую вставку большого количества строк за раз (десятки тысяч или даже миллионы сразу), чтобы минимизировать количество parts, которые необходимо объединить в фоновом процессе.
В этом руководстве мы пока не будем об этом беспокоиться. Выполните следующую команду, чтобы вставить несколько строк данных в вашу таблицу:
Выполните запрос к вашей новой таблице
Вы можете написать запрос SELECT
так же, как вы бы сделали это с любой SQL-базой данных:
Обратите внимание, что ответ возвращается в красивом табличном формате:
Вставьте свои данные
Следующий шаг — это загрузка ваших собственных данных в ClickHouse. У нас есть множество табличных функций и интеграций для загрузки данных. У нас есть примеры в вкладках ниже, или вы можете ознакомиться с нашей страницей Интеграции для получения длинного списка технологий, которые интегрируются с ClickHouse.
- S3
- GCS
- Web
- Локальный
- PostgreSQL
- MySQL
- ODBC/JDBC
- Сообщения
- Хранилища данных
- Другие
Используйте s3
таблицу функцию, чтобы читать файлы из S3. Это таблица-функция, что означает, что результатом является таблица, которая может быть:
- использована в качестве источника для запроса
SELECT
(что позволяет вам выполнять произвольные запросы и оставлять ваши данные в S3), или... - вставить полученную таблицу в таблицу
MergeTree
(когда вы готовы переместить ваши данные в ClickHouse)
Произвольный запрос выглядит следующим образом:
Перемещение данных в таблицу ClickHouse выглядит следующим образом, где nyc_taxi
— это таблица MergeTree
:
Посмотрите нашу коллекцию страниц документации по AWS S3 для получения множества подробностей и примеров использования S3 с ClickHouse.
Таблица функция s3
, используемая для чтения данных в AWS S3, также работает с файлами в Google Cloud Storage.
Например:
Найдите больше подробностей на странице s3
таблицы функции.
Таблица функция url
читает файлы, доступные из интернета:
Найдите больше подробностей на странице url
таблицы функции.
Используйте file
таблицы функции, чтобы читать локальный файл. Для простоты скопируйте файл в директорию user_files
(которая находится в директории, куда вы скачали бинарный файл ClickHouse).
Обратите внимание, что ClickHouse определяет имена и типы данных ваших колонок, анализируя большой пакет строк. Если ClickHouse не может определить тип хранения из имени файла, вы можете указать его в качестве второго аргумента:
Посмотрите страницу документации по file
таблицы функции для получения большей информации.
Используйте postgresql
таблицы функции, чтобы читать данные из таблицы в PostgreSQL:
Посмотрите страницу документации по postgresql
таблицы функции для получения большей информации.
Используйте mysql
таблицы функции, чтобы читать данные из таблицы в MySQL:
Посмотрите страницу документации по mysql
таблицы функции для получения большей информации.
ClickHouse может читать данные из любого источника ODBC или JDBC:
Посмотрите страницы документации по odbc
таблицы функции и jdbc
таблицы функции для получения большей информации.
Очереди сообщений могут передавать данные в ClickHouse с использованием соответствующего движка таблицы, включая:
- Kafka: интеграция с Kafka с использованием
Kafka
движка таблицы - Amazon MSK: интеграция с Управляемой потоковой передачей для Apache Kafka Amazon (MSK)
- RabbitMQ: интеграция с RabbitMQ с использованием
RabbitMQ
движка таблицы
ClickHouse имеет таблицы функции для чтения данных из следующих источников:
- Hadoop: интеграция с Apache Hadoop с использованием
hdfs
таблицы функции - Hudi: чтение из существующих таблиц Apache Hudi в S3 с использованием
hudi
таблицы функции - Iceberg: чтение из существующих таблиц Apache Iceberg в S3 с использованием
iceberg
таблицы функции - DeltaLake: чтение из существующих таблиц Delta Lake в S3 с использованием
deltaLake
таблицы функции
Посмотрите наш длинный список интеграций ClickHouse, чтобы узнать, как подключить ваши существующие фреймворки и источники данных к ClickHouse.
Следующие шаги
- Ознакомьтесь с нашим разделом Основные концепции, чтобы узнать некоторые из основ, как ClickHouse работает под капотом.
- Ознакомьтесь с Расширенным учебником, который более подробно рассматривает ключевые концепции и возможности ClickHouse.
- Продолжайте обучение, пройдя наши бесплатные курсы по запросу на ClickHouse Academy.
- У нас есть список примеров наборов данных с инструкциями о том, как их вставить.
- Если ваши данные поступают из внешнего источника, посмотрите нашу коллекцию руководств по интеграции для подключения к очередям сообщений, базам данных, конвейерам и прочему.
- Если вы используете инструмент визуализации UI/BI, ознакомьтесь с руководствами для пользователей по подключению UI к ClickHouse.
- Руководство пользователя по первичным ключам — это все, что вам нужно знать о первичных ключах и о том, как их определять.