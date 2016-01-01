pg_clickhouse

pg_clickhouse — это расширение PostgreSQL с открытым исходным кодом, позволяющее выполнять аналитические запросы в ClickHouse прямо из PostgreSQL без переписывания SQL. Оно поддерживает PostgreSQL 13 и выше и ClickHouse v23 и выше.

Когда ClickPipes начинает синхронизировать данные с ClickHouse, используйте pg_clickhouse, чтобы быстро import foreign tables в схему PostgreSQL. Затем запускайте существующие запросы PostgreSQL к этим таблицам, сохраняя текущую кодовую базу и при этом передавая выполнение запросов в ClickHouse.

Самый простой способ опробовать pg_clickhouse — использовать Docker image, который представляет собой стандартный Docker-образ PostgreSQL с расширением pg_clickhouse:

docker run --name pg_clickhouse -e POSTGRES_PASSWORD=my_pass \ -d ghcr.io/clickhouse/pg_clickhouse:18 docker exec -it pg_clickhouse psql -U postgres -c 'CREATE EXTENSION pg_clickhouse'

См. [руководство], чтобы начать импортировать таблицы ClickHouse и выполнять запросы на стороне ClickHouse.

В этой таблице сравнивается производительность запросов TPC-H между обычными таблицами PostgreSQL и pg_clickhouse, подключённым к ClickHouse, в обоих случаях использован коэффициент масштабирования 1; ✅ обозначает полный pushdown, а дефис — отмену запроса через 1 минуту. Все тесты запускались на MacBook Pro M4 Max с 36 ГБ памяти.

Пакеты разработки для PostgreSQL и curl включают pg_config и curl-config в PATH , поэтому вы можете просто выполнить make (или gmake ), затем make install , а затем выполнить в вашей базе данных команду CREATE EXTENSION http .

Подробности см. в разделе PostgreSQL Apt, описывающем использование репозитория PostgreSQL Apt.

sudo apt install \ postgresql-server-18 \ libcurl4-openssl-dev \ uuid-dev \ libssl-dev \ make \ cmake \ g++

sudo yum install \ postgresql-server \ libcurl-devel \ libuuid-devel \ openssl-libs \ automake \ cmake \ gcc

Подробности о получении пакетов из репозитория PostgreSQL Yum см. в разделе PostgreSQL Yum.

После установки всех перечисленных выше зависимостей используйте PGXN client (доступен в виде пакетов Homebrew, Apt и Yum с именем pgxnclient ), чтобы загрузить, скомпилировать и установить pg_clickhouse :

pgxn install pg_clickhouse

Чтобы собрать и установить библиотеку ClickHouse и pg_clickhouse , выполните следующую команду:

make sudo make install

Если на вашем хосте установлено несколько версий PostgreSQL, вам может понадобиться указать нужную версию pg_config :

export PG_CONFIG=/usr/lib/postgresql/18/bin/pg_config make sudo make install

Если утилита curl-config отсутствует в PATH на хосте, вы можете явно указать к ней путь:

export CURL_CONFIG=/opt/homebrew/opt/curl/bin/curl-config make sudo make install

Если вы столкнетесь с такой ошибкой, как:

"Makefile", line 8: Need an operator

Вам нужно использовать GNU make, который может быть установлен на вашей системе как gmake :

gmake gmake install gmake installcheck

Если вы получите ошибку вроде следующей:

make: pg_config: Command not found

Убедитесь, что pg_config установлен и находится в вашем PATH . Если вы устанавливали PostgreSQL с помощью системы управления пакетами, такой как RPM, убедитесь, что пакет -devel также установлен. При необходимости укажите процессу сборки, где найти pg_config :

export PG_CONFIG=/path/to/pg_config make sudo make install

Чтобы установить расширение в пользовательский префикс в PostgreSQL 18 или более поздней версии, передайте аргумент prefix команде install (но не другим целям make ):

sudo make install prefix=/usr/local/extras

Затем убедитесь, что префикс указан в следующих параметрах файла [ postgresql.conf ]:

extension_control_path = '/usr/local/extras/postgresql/share:$system' dynamic_library_path = '/usr/local/extras/postgresql/lib:$libdir'

После установки расширения для запуска набора тестов выполните

make installcheck

Если вы столкнётесь с ошибкой, например:

ERROR: must be owner of database regression

Нужно запустить набор тестов от имени суперпользователя, например, стандартного суперпользователя по умолчанию "postgres":

make installcheck PGUSER=postgres

После установки pg_clickhouse вы можете добавить его в базу данных, подключившись с правами суперпользователя и выполнив следующую команду:

CREATE EXTENSION pg_clickhouse;

Если вы хотите установить pg_clickhouse и все его вспомогательные объекты в определённую схему, используйте предложение SCHEMA , чтобы указать эту схему следующим образом:

CREATE SCHEMA env; CREATE EXTENSION pg_clickhouse SCHEMA env;

Для работы расширения pg_clickhouse требуются PostgreSQL 13 или новее, libcurl, libuuid. Для сборки расширения необходимы компилятор C и C++, libSSL, GNU make и CMake.

Наш главный приоритет — завершить покрытие pushdown-оптимизаций для аналитических нагрузок, прежде чем добавлять функции DML. Наша дорожная карта:

Добиться оптимального планирования для оставшихся 10 запросов TPC-H, для которых ещё не выполняется pushdown

Протестировать и исправить pushdown для запросов ClickBench

Обеспечить прозрачный pushdown всех агрегатных функций PostgreSQL

Обеспечить прозрачный pushdown всех функций PostgreSQL

Разрешить задание параметров ClickHouse на уровне сервера и сессии с помощью CREATE SERVER и GUC

Поддержать все типы данных ClickHouse

Поддержать операции легковесного DELETE и UPDATE

Поддержать пакетную вставку через COPY

Добавить функцию для выполнения произвольного запроса ClickHouse и возврата его результатов в виде таблицы

Добавить поддержку pushdown для запросов с UNION, когда все они обращаются к удалённой базе данных