ClickPipes 用于流式传输和对象存储

本节概述了 ClickPipes 用于流式传输和对象存储的定价模型。

它由两个维度组成：

计算 ：每单位每小时的价格。 计算代表了运行 ClickPipes 副本 Pod 的成本，无论它们是否积极接收数据。 它适用于所有 ClickPipes 类型。

：每单位每小时的价格。 计算代表了运行 ClickPipes 副本 Pod 的成本，无论它们是否积极接收数据。 它适用于所有 ClickPipes 类型。 接收的数据：按每 GB 的价格。 接收的数据费率适用于所有流式 ClickPipes （Kafka, Confluent, Amazon MSK, Amazon Kinesis, Redpanda, WarpStream, Azure Event Hubs）， 适用于通过副本 Pod 传输的数据。接收的数据大小（GB）是基于从源接收的字节（未压缩或压缩）收费。

ClickPipes 通过独立的基础设施从远程数据源接收数据， 该基础设施独立于 ClickHouse Cloud 服务运行和扩展。 因此，它使用专用的计算副本。

每个 ClickPipe 默认提供 1 个副本，配备 512 MiB 的 RAM 和 0.125 vCPU (XS)。 这相当于 0.0625 ClickHouse 计算单位（1 单位 = 8 GiB RAM, 2 vCPUs）。

计算：每单位每小时 $0.20（默认副本大小下每副本每小时 $0.0125）

接收的数据：每 GB $0.04

计算维度的价格取决于 ClickPipe 中副本的 数量 和 大小。默认副本大小可以通过垂直扩展进行调整，且每个副本大小的定价如下：

副本大小 计算单位 RAM vCPU 每小时价格 超小型 (XS) (默认) 0.0625 512 MiB 0.125 $0.0125 小型 (S) 0.125 1 GiB 0.25 $0.025 中型 (M) 0.25 2 GiB 0.5 $0.05 大型 (L) 0.5 4 GiB 1.0 $0.10 特大 (XL) 1.0 8 GiB 2.0 $0.20

以下示例假设有一个 M 大小的单一副本，除非明确提及。

100 GB 在 24 小时内 1 TB 在 24 小时内 10 TB 在 24 小时内 流式 ClickPipe (0.25 x 0.20 x 24) + (0.04 x 100) = $5.20 (0.25 x 0.20 x 24) + (0.04 x 1000) = $41.20 使用 4 个副本：

(0.25 x 0.20 x 24 x 4) + (0.04 x 10000) = $404.80 对象存储 ClickPipe ∗ ^* ∗ (0.25 x 0.20 x 24) = $1.20 (0.25 x 0.20 x 24) = $1.20 (0.25 x 0.20 x 24) = $1.20

1 ^1 1 仅 ClickPipes 的计算用于编排， 有效的数据传输由底层 Clickhouse 服务承担

什么是 ClickPipes 副本？ ClickPipes 通过专用基础设施从远程数据源摄取数据，这些基础设施独立于 ClickHouse Cloud 服务运行和扩展。 因此，它使用专用计算副本。 下面的图表展示了简化的架构。 对于流式 ClickPipes，ClickPipes 副本访问远程数据源（例如：Kafka 代理），拉取数据，处理并将其摄取到目标 ClickHouse 服务中。 在对象存储 ClickPipes 的情况下， ClickPipes 副本协调数据加载任务 （识别要复制的文件，维护状态，并移动分区）， 而数据则直接从 ClickHouse 服务拉取。

副本的默认数量及其大小是多少？ 每个 ClickPipe 默认有 1 个副本，配备 2 GiB 的 RAM 和 0.5 vCPU。 这对应于 0.25 ClickHouse 计算单位（1 单位 = 8 GiB RAM，2 vCPUs）。

ClickPipes 副本可以扩展吗？ 是的，流式 ClickPipes 可以横向和纵向扩展。 横向扩展增加更多副本以提高吞吐量，而纵向扩展则增加分配给每个副本的资源（CPU 和 RAM），以处理更密集的工作负载。 这可以在 ClickPipe 创建期间配置，或者在 设置 -> 高级设置 -> 扩展 下的任何其他时候配置。

我需要多少个 ClickPipes 副本？ 这取决于工作负载的吞吐量和延迟要求。 我们建议从 1 个副本的默认值开始，测量延迟，并根据需要添加副本。 请记住，对于 Kafka ClickPipes，您还必须相应地扩展 Kafka 代理的分区。 扩展控件在每个流式 ClickPipe 的“设置”中可用。

在一个示例中看起来如何？ 例如，使用 Kafka 连接器以单个副本（0.25 计算单位）在 24 小时内摄取 1 TB 数据的成本为： ( 0.25 × 0.20 × 24 ) + ( 0.04 × 1000 ) = $ 41.2 (0.25 \times 0.20 \times 24) + (0.04 \times 1000) = \$41.2 ( 0.25 × 0.20 × 24 ) + ( 0.04 × 1000 ) = $41.2

对于对象存储连接器（S3 和 GCS）， 只会产生 ClickPipes 计算成本，因为 ClickPipes pod 并未处理数据 而仅仅是协调由底层的 ClickHouse 服务操作的传输： 0.25 × 0.20 × 24 = $ 1.2 0.25 \times 0.20 \times 24 = \$1.2 0.25 × 0.20 × 24 = $1.2