跳转到主内容
跳转到主内容

pg_clickhouse

介绍

pg_clickhouse 是一个开源的 PostgreSQL 扩展,可以直接在 PostgreSQL 中对 ClickHouse 运行分析查询,而无需重写任何 SQL。它支持 PostgreSQL 13 及以上版本以及 ClickHouse v23 及以上版本。

一旦 ClickPipes 开始向 ClickHouse 同步数据,即可使用 pg_clickhouse 将[导入外部表]到 PostgreSQL 的某个 schema 中,快速且便捷。随后可以对这些表运行现有的 PostgreSQL 查询,在将执行下推到 ClickHouse 的同时保留现有的代码库。

入门

试用 pg_clickhouse 的最简单方式是使用 [Docker 镜像],它 基于标准 PostgreSQL Docker 镜像并包含 pg_clickhouse 扩展:

docker run --name pg_clickhouse -e POSTGRES_PASSWORD=my_pass \
       -d ghcr.io/clickhouse/pg_clickhouse:18
docker exec -it pg_clickhouse psql -U postgres -c 'CREATE EXTENSION pg_clickhouse'

请参阅该 [教程],以开始导入 ClickHouse 表并启用查询下推。

测试用例:TPC-H

此表对比了在缩放因子为 1 时,TPC-H 查询在常规 PostgreSQL 表与通过 pg_clickhouse 连接到 ClickHouse 的表之间的性能;✔︎ 表示完全下推,而短横线(-)表示在 1 分钟后取消该查询。 所有测试均在配备 36 GB 内存的 MacBook Pro M4 Max 上运行。

查询PostgreSQLpg_clickhouse下推
[查询 1]4693 ms268 ms✔︎
[查询 2]458 ms3446 ms
[查询 3]742 ms111 ms✔︎
[查询 4]270 ms130 ms✔︎
[查询 5]337 ms1460 ms✔︎
[查询 6]764 ms53 ms✔︎
[查询 7]619 ms96 ms✔︎
[查询 8]342 ms156 ms✔︎
[查询 9]3094 ms298 ms✔︎
[查询 10]581 ms197 ms✔︎
[查询 11]212 ms24 ms✔︎
[查询 12]1116 ms84 ms✔︎
[查询 13]958 ms1368 ms
[查询 14]181 ms73 ms✔︎
[查询 15]1118 ms557 ms
[查询 16]497 ms1714 ms
[查询 17]1846 ms32709 ms
[查询 18]5823 ms10649 ms
[查询 19]53 ms206 ms✔︎
[查询 20]421 ms-
[查询 21]1349 ms4434 ms
[查询 22]258 ms1415 ms

从源代码编译

通用 Unix

PostgreSQL 和 curl 的开发包会在 PATH 中提供 pg_configcurl-config,因此你可以直接运行 make(或 gmake),然后执行 make install,接着在数据库中执行 CREATE EXTENSION pg_clickhouse

Debian / Ubuntu / APT

有关从 PostgreSQL Apt 软件仓库获取软件包的详细信息,请参阅 PostgreSQL Apt

sudo apt install \
  postgresql-server-18 \
  libcurl4-openssl-dev \
  uuid-dev \
  libssl-dev \
  make \
  cmake \
  g++

RedHat / CentOS / Yum

sudo yum install \
  postgresql-server \
  libcurl-devel \
  libuuid-devel \
  openssl-libs \
  automake \
  cmake \
  gcc

有关如何从 PostgreSQL Yum 仓库获取的详细信息,请参阅 PostgreSQL Yum

从 PGXN 安装

在满足上述依赖的前提下,使用 PGXN client(可通过 HomebrewApt 以及名为 pgxnclient 的 Yum 软件包安装)来下载、编译 并安装 pg_clickhouse

pgxn install pg_clickhouse

编译并安装

要构建并安装 ClickHouse 库和 pg_clickhouse,运行:

make
sudo make install

如果你的主机上有多个 PostgreSQL 安装,你可能需要指定对应版本的 pg_config

export PG_CONFIG=/usr/lib/postgresql/18/bin/pg_config
make
sudo make install

如果主机的 PATH 中没有 curl-config,可以显式指定其路径:

export CURL_CONFIG=/opt/homebrew/opt/curl/bin/curl-config
make
sudo make install

如果遇到如下错误:

"Makefile", line 8: Need an operator

你需要使用 GNU make,你的系统上很可能是以 gmake 的形式安装的:

gmake
gmake install
gmake installcheck

如果遇到如下错误:

make: pg_config: Command not found

请确保已安装 pg_config,并且它位于你的 PATH 中。如果你使用 RPM 等软件包管理系统安装了 PostgreSQL,请确保同时安装了 -devel 软件包。如有必要,请在构建过程中显式指定它的路径:

export PG_CONFIG=/path/to/pg_config
make
sudo make install

要在 PostgreSQL 18 或更高版本中将该扩展安装到自定义前缀,请在执行 install 时传递 prefix 参数(不要对其他任何 make 目标传递该参数):

sudo make install prefix=/usr/local/extras

然后确保在以下 [postgresql.conf 参数] 中包含该前缀:

extension_control_path = '/usr/local/extras/postgresql/share:$system'
dynamic_library_path   = '/usr/local/extras/postgresql/lib:$libdir'

测试

扩展安装完成后,如需运行测试套件,请执行

make installcheck

如果遇到如下错误:

ERROR:  must be owner of database regression

你需要以超级用户身份运行测试套件,例如使用默认的“postgres”超级用户:

make installcheck PGUSER=postgres

加载

安装 pg_clickhouse 之后,以超级用户身份连接到数据库并运行以下命令即可将其添加到该数据库:

CREATE EXTENSION pg_clickhouse;

如果希望将 pg_clickhouse 及其所有相关对象安装到特定的 schema 中,请使用 SCHEMA 子句指定该 schema,如下所示:

CREATE SCHEMA env;
CREATE EXTENSION pg_clickhouse SCHEMA env;

依赖项

pg_clickhouse 扩展需要 PostgreSQL 13 或更高版本、libcurllibuuid。构建该扩展需要 C 和 C++ 编译器、libSSLGNU makeCMake

路线图

我们当前的首要任务是在添加 DML 功能之前,先完成针对分析型工作负载的下推覆盖。我们的路线图如下:

  • 让剩余 10 条尚未下推的 TPC-H 查询都能生成最优执行计划
  • 测试并修复 ClickBench 查询的下推
  • 支持对所有 PostgreSQL 聚合函数的透明下推
  • 支持对所有 PostgreSQL 函数的透明下推
  • 通过 CREATE SERVER 和 GUCs 支持在服务器级别和会话级别配置 ClickHouse 设置
  • 支持所有 ClickHouse 数据类型
  • 支持轻量级删除和 UPDATE
  • 支持通过 COPY 进行批量插入
  • 增加一个函数,用于执行任意 ClickHouse 查询,并将其结果作为一张表返回
  • 当所有子查询都访问远程数据库时,增加对 UNION 查询下推的支持

作者

  • 版权所有 (c) 2025-2026, ClickHouse
  • 部分版权所有 (c) 2023-2025, Ildus Kurbangaliev
  • 部分版权所有 (c) 2019-2023, Adjust GmbH
  • 部分版权所有 (c) 2012-2019, PostgreSQL Global Development Group

[查询 1] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/1.sql [查询 2] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/2.sql [查询 3] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/3.sql [查询 4] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/4.sql [查询 5] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/5.sql [查询 6] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/6.sql [查询 7] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/7.sql [查询 8] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/8.sql [查询 9] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/9.sql [查询 10] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/10.sql [查询 11] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/11.sql [查询 12] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/12.sql [查询 13] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/13.sql [查询 14] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/14.sql [查询 15] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/15.sql [查询 16] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/16.sql [查询 17] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/17.sql [查询 18] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/18.sql [查询 19] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/19.sql [查询 20] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/20.sql [查询 21] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/21.sql [查询 22] https://github.com/ClickHouse/pg_clickhouse/blob/main/dev/tpch/queries/22.sql