Google Dataflow 模板
Google Dataflow 模板提供了一种便捷的方法来执行预构建、现成可用的数据管道,而无需编写自定义代码。这些模板旨在简化常见的数据处理任务,并使用 Apache Beam 进行构建,利用 ClickHouseIO
等连接器与 ClickHouse 数据库无缝集成。通过在 Google Dataflow 上运行这些模板,您可以以最小的努力实现高度可扩展的分布式数据处理。
为什么使用 Dataflow 模板?
- 易于使用:模板通过提供针对特定用例量身定制的预配置管道,消除了编码的需求。
- 可扩展性:Dataflow 确保您的管道有效扩展,处理大容量数据并进行分布式处理。
- 成本效益:只为您消耗的资源付费,并能够优化管道执行成本。
如何运行 Dataflow 模板
截至今天,ClickHouse 官方模板可通过 Google Cloud CLI 或 Dataflow REST API 获得。 有关详细的逐步说明,请参阅 Google Dataflow 从模板运行管道指南。
ClickHouse 模板列表
- 从 BigQuery 到 ClickHouse
- 从 GCS 到 ClickHouse(即将推出!)
- 从 Pub Sub 到 ClickHouse(即将推出!)