MaterializedPostgreSQL 表引擎
对于 ClickHouse Cloud 用户,推荐使用 ClickPipes 将 PostgreSQL 数据复制到 ClickHouse。它原生支持高性能的 PostgreSQL CDC(变更数据捕获)。
创建一个 ClickHouse 表,对 PostgreSQL 表进行初始数据转储,并启动复制过程,即在后台执行作业,将远程 PostgreSQL 数据库中该 PostgreSQL 表上发生的新变更实时应用到该表中。
此表引擎为实验特性。要使用它,请在配置文件中将 allow_experimental_materialized_postgresql_table 设置为 1,或通过 SET 命令进行设置:
如果需要使用多个表,强烈建议使用 MaterializedPostgreSQL 数据库引擎而不是表引擎,并通过 materialized_postgresql_tables_list 设置来指定要复制的表(后续也可以添加数据库 schema)。在 CPU 占用、连接数以及远程 PostgreSQL 数据库中所占用的复制槽数量方面,这种方式都会更优。
创建表
引擎参数
host:port— PostgreSQL 服务器地址。database— 远程数据库名。table— 远程表名。user— PostgreSQL 用户。password— 用户密码。
要求
-
在 PostgreSQL 配置文件中,wal_level 设置必须为
logical,并且max_replication_slots参数的值至少为2。 -
使用
MaterializedPostgreSQL引擎的表必须具有主键,且该主键必须与 PostgreSQL 表的副本标识索引(默认:主键)相同(参见副本标识索引的详细信息)。 -
仅允许使用 Atomic 数据库。
-
由于实现依赖于 PostgreSQL 的 pg_replication_slot_advance 函数,
MaterializedPostgreSQL表引擎仅适用于 PostgreSQL 版本 >= 11。
虚拟列
在创建表时不需要显式添加这些列。它们在 SELECT 查询中始终可用。
_version 列等于 WAL 中的 LSN 位置,因此可用于检查复制的同步进度。
不支持对 TOAST 值进行复制。将使用该数据类型的默认值。