跳到主要内容
跳到主要内容

Google Dataflow 模板

Google Dataflow 模板提供了一种便捷的方法来执行预构建、现成可用的数据管道,而无需编写自定义代码。这些模板旨在简化常见的数据处理任务,并使用 Apache Beam 进行构建,利用 ClickHouseIO 等连接器与 ClickHouse 数据库无缝集成。通过在 Google Dataflow 上运行这些模板,您可以以最小的努力实现高度可扩展的分布式数据处理。

为什么使用 Dataflow 模板?

  • 易于使用:模板通过提供针对特定用例量身定制的预配置管道,消除了编码的需求。
  • 可扩展性:Dataflow 确保您的管道有效扩展,处理大容量数据并进行分布式处理。
  • 成本效益:只为您消耗的资源付费,并能够优化管道执行成本。

如何运行 Dataflow 模板

截至今天,ClickHouse 官方模板可通过 Google Cloud CLI 或 Dataflow REST API 获得。 有关详细的逐步说明,请参阅 Google Dataflow 从模板运行管道指南

ClickHouse 模板列表