跳到主要内容

跳到主要内容

对象存储 ClickPipes 提供了一种简单且健壮的方式，用于将 Amazon S3、Google Cloud Storage、Azure Blob Storage 和 DigitalOcean Spaces 中的数据摄取到 ClickHouse Cloud。既支持一次性摄取，也支持持续摄取，并保证严格一次（exactly-once）语义。

创建第一个对象存储 ClickPipe

先决条件

您已阅读并熟悉 ClickPipes 简介。

进入数据源

在云控制台左侧菜单中选择 Data Sources 按钮，然后点击“Set up a ClickPipe”

选择导入项

选择数据源

选择数据源。

选择数据源类型

配置 ClickPipe

在表单中为 ClickPipe 填写名称、描述（可选）、IAM 角色或凭证以及存储桶（bucket）URL。你可以使用类似 Bash 的通配符来指定多个文件。有关更多信息，请参阅关于在路径中使用通配符的文档。

填写连接详情

选择数据格式

UI 会显示指定 bucket 中的文件列表。选择你的数据格式（当前支持部分 ClickHouse 格式），并选择是否要启用持续摄取。（下面有更多细节）。

设置数据格式和主题

配置表、表结构和设置

在下一步中，你可以选择将数据摄取到一个新的 ClickHouse 表中，或者复用一个已有的表。按照界面上的指引修改你的表名、表结构和设置。你可以在顶部的示例表中实时预览你的更改。

配置表、表结构和设置

你也可以使用提供的控件自定义高级设置。

配置高级设置

或者，你也可以选择将数据摄取到已有的 ClickHouse 表中。在这种情况下，UI 允许你将源中的字段映射到所选目标表中的 ClickHouse 字段。

使用现有表

参考资料

你也可以将虚拟列（例如 _path 或 _size）映射到字段上。

配置权限

最后，您可以为内部 ClickPipes 用户配置权限。

权限： ClickPipes 会创建一个专用用户，用于向目标表写入数据。您可以为该内部用户选择一个角色，可以是自定义角色或预定义角色之一：

Full access：对整个集群具有完全访问权限。如果您在目标表上使用物化视图或 Dictionary，则需要选择此角色。
Only destination table：仅对目标表具有 INSERT 权限。

Permissions

完成设置

点击“Complete Setup”后，系统会注册你的 ClickPipe，你就可以在汇总表中看到它的条目。

成功提示

移除提示

汇总表提供操作项，用于显示来自源或 ClickHouse 中目标表的示例数据。

查看目标

同时还提供操作项，用于移除该 ClickPipe 并显示摄取任务的概要信息。

查看概览

恭喜！ 你已成功完成第一个 ClickPipe 的设置。如果这是一个流式 ClickPipe，它将持续运行，从你的远程数据源实时摄取数据。否则，它会完成该批次数据的摄取后自动结束。

先决条件
进入数据源
选择数据源
配置 ClickPipe
选择数据格式
配置表、表结构和设置
配置权限
完成设置

Was this page helpful?