pg_clickhouse
Введение
pg_clickhouse — это расширение PostgreSQL с открытым исходным кодом, позволяющее выполнять аналитические запросы в ClickHouse прямо из PostgreSQL без переписывания SQL. Оно поддерживает PostgreSQL 13 и выше и ClickHouse v23 и выше.
Когда ClickPipes начинает синхронизировать данные с ClickHouse, используйте pg_clickhouse, чтобы быстро import foreign tables в схему PostgreSQL. Затем запускайте существующие запросы PostgreSQL к этим таблицам, сохраняя текущую кодовую базу и при этом передавая выполнение запросов в ClickHouse.
Первые шаги
Самый простой способ опробовать pg_clickhouse — использовать Docker image, который представляет собой стандартный Docker-образ PostgreSQL с расширением pg_clickhouse:
См. [руководство], чтобы начать импортировать таблицы ClickHouse и выполнять запросы на стороне ClickHouse.
Тестовый сценарий: TPC-H
В этой таблице сравнивается производительность запросов TPC-H между обычными таблицами PostgreSQL и pg_clickhouse, подключённым к ClickHouse, в обоих случаях использован коэффициент масштабирования 1; ✅ обозначает полный pushdown, а дефис — отмену запроса через 1 минуту. Все тесты запускались на MacBook Pro M4 Max с 36 ГБ памяти.
|Query
|Pushdown
|pg_clickhouse
|PostgreSQL
|Query 1
|✅
|73ms
|4478ms
|Query 2
|-
|560ms
|Query 3
|✅
|74ms
|1454ms
|Query 4
|✅
|67ms
|650ms
|Query 5
|✅
|104ms
|452ms
|Query 6
|✅
|42ms
|740ms
|Query 7
|✅
|83ms
|633ms
|Query 8
|✅
|114ms
|320ms
|Query 9
|✅
|136ms
|3028ms
|Query 10
|✅
|10ms
|6ms
|Query 11
|✅
|78ms
|213ms
|Query 12
|✅
|37ms
|1101ms
|Query 13
|1242ms
|967ms
|Query 14
|✅
|51ms
|193ms
|Query 15
|522ms
|1095ms
|Query 16
|1797ms
|492ms
|Query 17
|9ms
|1802ms
|Query 18
|10ms
|6185ms
|Query 19
|532ms
|64ms
|Query 20
|4595ms
|473ms
|Query 21
|1702ms
|1334ms
|Query 22
|268ms
|257ms
Сборка из исходного кода
Прочие Unix-системы
Пакеты разработки для PostgreSQL и curl включают
pg_config и
curl-config в
PATH, поэтому вы можете просто выполнить
make (или
gmake), затем
make install, а затем выполнить в вашей базе данных команду
CREATE EXTENSION http.
Debian / Ubuntu / APT
Подробности см. в разделе PostgreSQL Apt, описывающем использование репозитория PostgreSQL Apt.
RedHat / CentOS / Yum
Подробности о получении пакетов из репозитория PostgreSQL Yum см. в разделе PostgreSQL Yum.
Установка из PGXN
После установки всех перечисленных выше зависимостей используйте PGXN client (доступен в виде пакетов Homebrew, Apt и Yum с именем
pgxnclient), чтобы загрузить, скомпилировать
и установить
pg_clickhouse:
Сборка и установка
Чтобы собрать и установить библиотеку ClickHouse и
pg_clickhouse, выполните следующую команду:
Если на вашем хосте установлено несколько версий PostgreSQL, вам может понадобиться указать
нужную версию
pg_config:
Если утилита
curl-config отсутствует в
PATH на хосте, вы можете явно указать к ней путь:
Если вы столкнетесь с такой ошибкой, как:
Вам нужно использовать GNU make, который может быть установлен на вашей системе как
gmake:
Если вы получите ошибку вроде следующей:
Убедитесь, что
pg_config установлен и находится в вашем
PATH. Если вы устанавливали PostgreSQL с помощью
системы управления пакетами, такой как RPM, убедитесь, что пакет
-devel также установлен. При необходимости укажите процессу сборки, где найти
pg_config:
Чтобы установить расширение в пользовательский префикс в PostgreSQL 18 или более поздней версии, передайте
аргумент
prefix команде
install (но не другим целям
make):
Затем убедитесь, что префикс указан в следующих параметрах файла [
postgresql.conf]:
Тестирование
После установки расширения для запуска набора тестов выполните
Если вы столкнётесь с ошибкой, например:
Нужно запустить набор тестов от имени суперпользователя, например, стандартного суперпользователя по умолчанию "postgres":
Загрузка
После установки
pg_clickhouse вы можете добавить его в базу данных, подключившись с правами суперпользователя и выполнив следующую команду:
Если вы хотите установить
pg_clickhouse и все его вспомогательные объекты в
определённую схему, используйте предложение
SCHEMA, чтобы указать эту схему следующим образом:
Зависимости
Для работы расширения
pg_clickhouse требуются PostgreSQL 13 или новее, libcurl,
libuuid. Для сборки расширения необходимы компилятор C и C++, libSSL, GNU
make и CMake.
Дорожная карта
Наш главный приоритет — завершить покрытие pushdown-оптимизаций для аналитических нагрузок, прежде чем добавлять функции DML. Наша дорожная карта:
- Добиться оптимального планирования для оставшихся 10 запросов TPC-H, для которых ещё не выполняется pushdown
- Протестировать и исправить pushdown для запросов ClickBench
- Обеспечить прозрачный pushdown всех агрегатных функций PostgreSQL
- Обеспечить прозрачный pushdown всех функций PostgreSQL
- Разрешить задание параметров ClickHouse на уровне сервера и сессии с помощью CREATE SERVER и GUC
- Поддержать все типы данных ClickHouse
- Поддержать операции легковесного DELETE и UPDATE
- Поддержать пакетную вставку через COPY
- Добавить функцию для выполнения произвольного запроса ClickHouse и возврата его результатов в виде таблицы
- Добавить поддержку pushdown для запросов с UNION, когда все они обращаются к удалённой базе данных
Авторы
Авторские права
- Copyright (c) 2025-2026, ClickHouse
- Отдельные части — Copyright (c) 2023-2025, Ildus Kurbangaliev
- Отдельные части — Copyright (c) 2019-2023, Adjust GmbH
- Отдельные части — Copyright (c) 2012-2019, PostgreSQL Global Development Group