跳转到主内容
跳转到主内容

湖仓表格式入门

本指南通过动手实践演示 ClickHouse 在湖仓表格式方面提供的核心能力。

就地查询数据

ClickHouse 可以作为针对存储在对象存储中的开放表格式的查询引擎使用。无需复制数据,用户即可将 ClickHouse 指向已有的 Iceberg、Delta Lake、Hudi 或 Paimon 表并立即开始查询,无论是用于支撑生产工作负载还是交互式地探索数据。这既可以通过使用表函数和表引擎进行直接读取来实现,也可以通过连接到数据目录来完成。

  • 直接查询开放表格式 — 使用 ClickHouse 表函数读取对象存储中的 Iceberg、Delta Lake、Hudi 和 Paimon 表,无需任何预先配置步骤。
  • 连接到数据目录 — 将数据目录暴露为 ClickHouse 数据库,并使用标准 SQL 查询其中的表。建议在需要访问目录中的多个表时采用此方式。

加速分析

对于需要低延迟响应和高并发的工作负载,将开放表格式中的数据加载到 ClickHouse 的 MergeTree 引擎中可以显著提升性能。其对稀疏主索引、跳过索引以及列式存储的利用,使得对 Parquet 文件需要数秒才能完成的查询能够在毫秒级完成。

将数据写回

数据也可以从 ClickHouse 写回到开放表格式。无论是将老化数据迁移到长期存储,还是将转换结果发布供下游使用,ClickHouse 都可以将数据写入对象存储中的 Iceberg 和 Delta 表。