Kafka 表引擎

提示

如果您在使用 ClickHouse Cloud，我们推荐改用 ClickPipes。ClickPipes 原生支持私有网络连接，可分别扩展摄取层和集群资源，并为将 Kafka 流式数据摄取到 ClickHouse 提供完善的监控能力。

发布或订阅数据流。
构建具备容错能力的存储。
在数据流到达时进行处理。

创建表

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [ALIAS expr1],
    name2 [type2] [ALIAS expr2],
    ...
) ENGINE = Kafka()
SETTINGS
    kafka_broker_list = 'host:port',
    kafka_topic_list = 'topic1,topic2,...',
    kafka_group_name = 'group_name',
    kafka_format = 'data_format'[,]
    [kafka_security_protocol = '',]
    [kafka_sasl_mechanism = '',]
    [kafka_sasl_username = '',]
    [kafka_sasl_password = '',]
    [kafka_schema = '',]
    [kafka_num_consumers = N,]
    [kafka_max_block_size = 0,]
    [kafka_skip_broken_messages = N,]
    [kafka_commit_every_batch = 0,]
    [kafka_client_id = '',]
    [kafka_poll_timeout_ms = 0,]
    [kafka_poll_max_batch_size = 0,]
    [kafka_flush_interval_ms = 0,]
    [kafka_thread_per_consumer = 0,]
    [kafka_handle_error_mode = 'default',]
    [kafka_commit_on_select = false,]
    [kafka_max_rows_per_message = 1,]
    [kafka_compression_codec = '',]
    [kafka_compression_level = -1];

必需参数：

kafka_broker_list — 以逗号分隔的 broker 列表（例如 localhost:9092）。
kafka_topic_list — Kafka 主题列表。
kafka_group_name — Kafka 消费者组。每个组的读取偏移量（offset）都会单独跟踪。如果你不希望消息在集群中被重复消费，请在所有地方使用相同的组名。
kafka_format — 消息格式。使用与 SQL FORMAT 函数相同的表示方式，例如 JSONEachRow。有关更多信息，请参阅 Formats 部分。

可选参数：

kafka_security_protocol - 用于与 broker 通信的协议。可选值：plaintext、ssl、sasl_plaintext、sasl_ssl。
kafka_sasl_mechanism - 用于认证的 SASL 机制。可选值：GSSAPI、PLAIN、SCRAM-SHA-256、SCRAM-SHA-512、OAUTHBEARER。
kafka_sasl_username - 与 PLAIN 和 SASL-SCRAM-.. 机制一起使用的 SASL 用户名。
kafka_sasl_password - 与 PLAIN 和 SASL-SCRAM-.. 机制一起使用的 SASL 密码。
kafka_schema — 当格式需要 schema 定义时必须使用的参数。例如，Cap'n Proto 需要提供 schema 文件的路径以及根 schema.capnp:Message 对象的名称。
kafka_schema_registry_skip_bytes — 在使用带信封头的 schema registry 时，从每条消息开头跳过的字节数（例如，AWS Glue Schema Registry 会包含一个 19 字节的信封）。范围：[0, 255]。默认值：0。
kafka_num_consumers — 每个表的 consumer 数量。如果单个 consumer 的吞吐量不足，请增加 consumer 数量。consumer 总数不应超过该 topic 的分区数，因为每个分区只能分配一个 consumer，并且不得大于部署 ClickHouse 的服务器上的物理 CPU 核心数。默认值：1。
kafka_max_block_size — 单次轮询的最大批大小（按消息数计）。默认值：max_insert_block_size。
kafka_skip_broken_messages — Kafka 消息解析器对每个 block 中与 schema 不兼容消息的容忍度。如果 kafka_skip_broken_messages = N，则引擎会跳过 N 条无法解析的 Kafka 消息（每条消息等于一行数据）。默认值：0。
kafka_commit_every_batch — 对每个已消费并处理的批次执行提交，而不是在写入整个 block 后仅提交一次。默认值：0。
kafka_client_id — 客户端标识符。默认值为空。
kafka_poll_timeout_ms — 从 Kafka 执行单次轮询的超时时间（毫秒）。默认值：stream_poll_timeout_ms。
kafka_poll_max_batch_size — 单次 Kafka 轮询中可获取的最大消息数量。默认值：max_block_size。
kafka_flush_interval_ms — 从 Kafka 刷新数据的时间间隔（毫秒）。默认值：stream_flush_interval_ms。
kafka_thread_per_consumer — 为每个 consumer 提供独立线程。启用后，每个 consumer 会独立、并行地刷新数据（否则来自多个 consumer 的行会被合并为一个 block）。默认值：0。
kafka_handle_error_mode — Kafka 引擎处理错误的方式。可选值：default（如果消息解析失败，将抛出异常）、stream（异常信息和原始消息将保存在虚拟列 _error 和 _raw_message 中）、dead_letter_queue（与错误相关的数据将保存在 system.dead_letter_queue 中）。
kafka_commit_on_select — 在执行 select 查询时提交消息。默认值：false。
kafka_max_rows_per_message — 对基于行的格式，每条 kafka 消息中写入的最大行数。默认值：1。
kafka_compression_codec — 用于生成消息的压缩编解码器。支持：空字符串、none、gzip、snappy、lz4、zstd。如果为空字符串，则该表不设置压缩编解码器，此时将使用配置文件中的值或 librdkafka 的默认值。默认值：空字符串。
kafka_compression_level — 由 kafka_compression_codec 选择的算法所使用的压缩级别参数。更高的值意味着更好的压缩率，但会消耗更多 CPU。可用范围依赖于算法：gzip 为 [0-9]；lz4 为 [0-12]；snappy 仅支持 0；zstd 为 [0-12]；-1 表示使用该编解码器的默认压缩级别。默认值：-1。

Examples:

  CREATE TABLE queue (
    timestamp UInt64,
    level String,
    message String
  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1', 'JSONEachRow');

  SELECT * FROM queue LIMIT 5;

  CREATE TABLE queue2 (
    timestamp UInt64,
    level String,
    message String
  ) ENGINE = Kafka SETTINGS kafka_broker_list = 'localhost:9092',
                            kafka_topic_list = 'topic',
                            kafka_group_name = 'group1',
                            kafka_format = 'JSONEachRow',
                            kafka_num_consumers = 4;

  CREATE TABLE queue3 (
    timestamp UInt64,
    level String,
    message String
  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1')
              SETTINGS kafka_format = 'JSONEachRow',
                       kafka_num_consumers = 4;

创建表的已弃用方法

注意

不要在新项目中使用此方法。如果可能，请将旧项目切换到上文所述的方法。

Kafka(kafka_broker_list, kafka_topic_list, kafka_group_name, kafka_format
      [, kafka_row_delimiter, kafka_schema, kafka_num_consumers, kafka_max_block_size,  kafka_skip_broken_messages, kafka_commit_every_batch, kafka_client_id, kafka_poll_timeout_ms, kafka_poll_max_batch_size, kafka_flush_interval_ms, kafka_thread_per_consumer, kafka_handle_error_mode, kafka_commit_on_select, kafka_max_rows_per_message]);

参考资料

Kafka 表引擎不支持包含默认值的列。如果您需要带默认值的列，可以在物化视图层添加它们（见下文）。

描述

已投递的消息会被自动跟踪，因此每个组中的每条消息只会被计数一次。如果你希望获取同一批数据两次，请创建一个使用不同 group 名称的表副本。

Group 十分灵活，并且会在集群中同步。例如，如果你在一个集群中有 10 个 topic 和 5 个表副本，那么每个副本会分配到 2 个 topic。如果副本数量发生变化，这些 topic 会在各个副本之间自动重新分配。更多信息请参阅 http://kafka.apache.org/intro。

建议为每个 Kafka topic 配置其专用的 consumer group，确保该 topic 与该 group 之间是一一对应的关系，特别是在会动态创建和删除 topic 的环境中（例如测试或预发布环境）。

SELECT 并不特别适合用于读取消息（除非用于调试），因为每条消息只能被读取一次。更实用的方式是通过物化视图创建实时处理链。为此，请执行以下步骤：

使用引擎创建一个 Kafka consumer，并将其视为数据流。
创建一个具有所需结构的表。
创建一个物化视图，将引擎中的数据转换后写入之前创建的表中。

当 MATERIALIZED VIEW 连接到该引擎时，它会在后台开始收集数据。这样你就可以持续地从 Kafka 接收消息，并使用 SELECT 将其转换为所需的格式。一个 Kafka 表可以拥有任意数量的物化视图，它们并不会直接从该 Kafka 表中读取数据，而是以数据块（blocks）的形式接收新增记录。通过这种方式，你可以将数据写入多张具有不同明细级别（带分组聚合和不带分组聚合）的表中。

示例：

  CREATE TABLE queue (
    timestamp UInt64,
    level String,
    message String
  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1', 'JSONEachRow');

  CREATE TABLE daily (
    day Date,
    level String,
    total UInt64
  ) ENGINE = SummingMergeTree(day, (day, level), 8192);

  CREATE MATERIALIZED VIEW consumer TO daily
    AS SELECT toDate(toDateTime(timestamp)) AS day, level, count() AS total
    FROM queue GROUP BY day, level;

  SELECT level, sum(total) FROM daily GROUP BY level;

为了提高性能，接收到的消息会被分组成大小为 max_insert_block_size 的数据块。如果在 stream_flush_interval_ms 毫秒内尚未形成该数据块，当前数据将会被刷新写入表中，而不考虑该数据块是否已填满。

要停止接收某个 topic 的数据或更改转换逻辑，请分离该物化视图：

  DETACH TABLE consumer;
  ATTACH TABLE consumer;

如果你想通过 ALTER 语句更改目标表，建议先禁用该物化视图，以避免目标表与视图产出的数据之间出现不一致。

配置

与 GraphiteMergeTree 类似，Kafka 引擎支持通过 ClickHouse 配置文件进行扩展配置。可以使用两个配置键：全局配置（位于 <kafka> 下）和主题级配置（位于 <kafka><kafka_topic> 下）。会先应用全局配置，然后再应用主题级配置（如果存在）。

  <kafka>
    <!-- Kafka 引擎类型所有表的全局配置选项 -->
    <debug>cgrp</debug>
    <statistics_interval_ms>3000</statistics_interval_ms>

    <kafka_topic>
        <name>logs</name>
        <statistics_interval_ms>4000</statistics_interval_ms>
    </kafka_topic>

    <!-- 消费者配置 -->
    <consumer>
        <auto_offset_reset>smallest</auto_offset_reset>
        <kafka_topic>
            <name>logs</name>
            <fetch_min_bytes>100000</fetch_min_bytes>
        </kafka_topic>

        <kafka_topic>
            <name>stats</name>
            <fetch_min_bytes>50000</fetch_min_bytes>
        </kafka_topic>
    </consumer>

    <!-- 生产者配置 -->
    <producer>
        <kafka_topic>
            <name>logs</name>
            <retry_backoff_ms>250</retry_backoff_ms>
        </kafka_topic>

        <kafka_topic>
            <name>stats</name>
            <retry_backoff_ms>400</retry_backoff_ms>
        </kafka_topic>
    </producer>
  </kafka>

有关可用配置选项的列表，请参阅 librdkafka 配置参考。在 ClickHouse 配置中，应使用下划线（_）而不是点号。例如，check.crcs=true 将写作 <check_crcs>true</check_crcs>。

Kerberos 支持

要与支持 Kerberos 的 Kafka 配合使用，请添加值为 sasl_plaintext 的 security_protocol 子元素。如果操作系统已经获取并缓存了 Kerberos 票据授予票（TGT，ticket-granting ticket），这就足够了。 ClickHouse 可以使用 keytab 文件维护 Kerberos 凭证。请考虑配置 sasl_kerberos_service_name、sasl_kerberos_keytab 和 sasl_kerberos_principal 子元素。

示例：

<!-- 启用 Kerberos 的 Kafka -->
<kafka>
  <security_protocol>SASL_PLAINTEXT</security_protocol>
  <sasl_kerberos_keytab>/home/kafkauser/kafkauser.keytab</sasl_kerberos_keytab>
  <sasl_kerberos_principal>kafkauser/[email protected]</sasl_kerberos_principal>
</kafka>

虚拟列

_topic — Kafka 主题。数据类型：LowCardinality(String)。
_key — 消息的 key。数据类型：String。
_offset — 消息的 offset。数据类型：UInt64。
_timestamp — 消息的时间戳。数据类型：Nullable(DateTime)。
_timestamp_ms — 消息的毫秒级时间戳。数据类型：Nullable(DateTime64(3))。
_partition — Kafka 主题的分区。数据类型：UInt64。
_headers.name — 消息头键的数组。数据类型：Array(String)。
_headers.value — 消息头值的数组。数据类型：Array(String)。

当 kafka_handle_error_mode='stream' 时的附加虚拟列：

_raw_message — 无法成功解析的原始消息。数据类型：String。
_error — 解析失败时抛出的异常信息。数据类型：String。

注意：只有在解析过程中发生异常时，_raw_message 和 _error 虚拟列才会被填充；当消息成功解析时，这两个列始终为空。

数据格式支持

Kafka 引擎支持 ClickHouse 所支持的所有格式。单个 Kafka 消息中的行数取决于所用格式是行级格式还是块级格式：

对于行级格式，可以通过设置 kafka_max_rows_per_message 来控制单个 Kafka 消息中的行数。
对于块级格式，我们无法将一个块再拆分为更小的部分，但可以通过通用设置 max_block_size 来控制单个块中的行数。

在 ClickHouse Keeper 中存储已提交 offset 的引擎

Experimental feature. Learn more.

如果启用了 allow_experimental_kafka_offsets_storage_in_keeper，则可以为 Kafka 表引擎额外指定两个设置：

kafka_keeper_path：指定该表在 ClickHouse Keeper 中的路径
kafka_replica_name：指定该表在 ClickHouse Keeper 中的副本名称

这两个设置要么同时指定，要么都不指定。当二者都被指定时，将会使用一个新的实验性 Kafka 引擎。这个新引擎不再依赖将已提交的 offset 存储在 Kafka 中，而是将其存储在 ClickHouse Keeper 中。它仍然会尝试将 offset 提交到 Kafka，但只在创建表时依赖这些 offset。在其他情况下（例如表被重启，或在发生错误后进行恢复）时，将使用存储在 ClickHouse Keeper 中的 offset 作为继续消费消息的起始位置。除了已提交的 offset，它还会存储上一个批次中已消费的消息数量，因此如果插入失败，将会再次消费相同数量的消息，从而在需要时实现去重。

示例：

CREATE TABLE experimental_kafka (key UInt64, value UInt64)
ENGINE = Kafka('localhost:19092', 'my-topic', 'my-consumer', 'JSONEachRow')
SETTINGS
  kafka_keeper_path = '/clickhouse/{database}/{uuid}',
  kafka_replica_name = '{replica}'
SETTINGS allow_experimental_kafka_offsets_storage_in_keeper=1;

已知限制

由于新引擎仍处于实验阶段，目前尚未准备好用于生产环境。当前实现存在以下一些已知限制：

最大的限制在于该引擎不支持直接读取。通过物化视图从该引擎读取以及向该引擎写入是可行的，但无法直接读取。因此，所有直接的 SELECT 查询都会失败。
频繁删除并重新创建表，或者为不同引擎指定相同的 ClickHouse Keeper 路径，可能会导致问题。作为最佳实践，建议在 kafka_keeper_path 中使用 {uuid} 来避免路径冲突。
为了实现可重复读取，消息不能在单个线程上从多个分区进行消费。另一方面，必须定期轮询 Kafka consumer 以保持其存活。鉴于这两个目标，我们决定仅在启用 kafka_thread_per_consumer 时才允许创建多个 consumer；否则，要避免与定期轮询 consumer 相关的问题将过于复杂。
由新存储引擎创建的 consumer 不会出现在 system.kafka_consumers 表中。

另请参阅

创建表​

描述​

配置​

Kerberos 支持​

虚拟列​

数据格式支持​

在 ClickHouse Keeper 中存储已提交 offset 的引擎​

已知限制​

创建表

描述

配置

Kerberos 支持

虚拟列

数据格式支持

在 ClickHouse Keeper 中存储已提交 offset 的引擎

已知限制