将 Google Cloud Storage 与 ClickHouse 集成

备注

如果您在 Google Cloud 上使用 ClickHouse Cloud，则该页面不适用，因为您的服务将已经使用 Google Cloud Storage。如果您希望从 GCS 中 SELECT 或 INSERT 数据，请参阅 gcs 表函数。

ClickHouse 认识到 GCS 代表了一种吸引人的存储解决方案，适合希望分离存储和计算的用户。为帮助实现这一目标，提供支持将 GCS 用作 MergeTree 引擎的存储。这使用户能够利用 GCS 的可扩展性和成本优势，以及 MergeTree 引擎的插入和查询性能。

GCS 支持的 MergeTree

创建磁盘

为了将 GCS 存储桶用作磁盘，我们必须先在 conf.d 下的 ClickHouse 配置文件中声明它。以下是 GCS 磁盘声明的示例。该配置包含多个部分，以配置 GCS “磁盘”、缓存和在 DDL 查询中创建表时指定的策略。下面对这些进行说明。

存储配置 > 磁盘 > gcs

该配置部分在高亮部分中给出，指定了：

不应执行批量删除。GCS 当前不支持批量删除，因此禁用了自动检测以抑制错误消息。
磁盘类型为 s3，因为正在使用 S3 API。
GCS 提供的终端节点
服务帐户 HMAC 密钥和密钥
本地磁盘上的元数据路径

<clickhouse>
    <storage_configuration>
        <disks>
            <gcs>
            <!--highlight-start-->
                <support_batch_delete>false</support_batch_delete>
                <type>s3</type>
                <endpoint>https://storage.googleapis.com/BUCKET NAME/FOLDER NAME/</endpoint>
                <access_key_id>SERVICE ACCOUNT HMAC KEY</access_key_id>
                <secret_access_key>SERVICE ACCOUNT HMAC SECRET</secret_access_key>
                <metadata_path>/var/lib/clickhouse/disks/gcs/</metadata_path>
            <!--highlight-end-->
            </gcs>
        </disks>
        <policies>
            <gcs_main>
                <volumes>
                    <main>
                        <disk>gcs</disk>
                    </main>
                </volumes>
            </gcs_main>
        </policies>
    </storage_configuration>
</clickhouse>

存储配置 > 磁盘 > 缓存

下方高亮的示例配置为磁盘 gcs 启用了 10Gi 的内存缓存。

<clickhouse>
    <storage_configuration>
        <disks>
            <gcs>
                <support_batch_delete>false</support_batch_delete>
                <type>s3</type>
                <endpoint>https://storage.googleapis.com/BUCKET NAME/FOLDER NAME/</endpoint>
                <access_key_id>SERVICE ACCOUNT HMAC KEY</access_key_id>
                <secret_access_key>SERVICE ACCOUNT HMAC SECRET</secret_access_key>
                <metadata_path>/var/lib/clickhouse/disks/gcs/</metadata_path>
            </gcs>
            <!--highlight-start-->
            <gcs_cache>
                <type>cache</type>
                <disk>gcs</disk>
                <path>/var/lib/clickhouse/disks/gcs_cache/</path>
                <max_size>10Gi</max_size>
            </gcs_cache>
            <!--highlight-end-->
        </disks>
        <policies>
            <gcs_main>
                <volumes>
                    <main>
                        <disk>gcs_cache</disk>
                    </main>
                </volumes>
            </gcs_main>
        </policies>
    </storage_configuration>
</clickhouse>

存储配置 > 策略 > gcs_main

存储配置策略允许选择数据存储的位置。下方高亮的策略允许通过指定策略 gcs_main 将数据存储在磁盘 gcs 上。例如，CREATE TABLE ... SETTINGS storage_policy='gcs_main'。

<clickhouse>
    <storage_configuration>
        <disks>
            <gcs>
                <support_batch_delete>false</support_batch_delete>
                <type>s3</type>
                <endpoint>https://storage.googleapis.com/BUCKET NAME/FOLDER NAME/</endpoint>
                <access_key_id>SERVICE ACCOUNT HMAC KEY</access_key_id>
                <secret_access_key>SERVICE ACCOUNT HMAC SECRET</secret_access_key>
                <metadata_path>/var/lib/clickhouse/disks/gcs/</metadata_path>
            </gcs>
        </disks>
        <policies>
            <!--highlight-start-->
            <gcs_main>
                <volumes>
                    <main>
                        <disk>gcs</disk>
                    </main>
                </volumes>
            </gcs_main>
            <!--highlight-end-->
        </policies>
    </storage_configuration>
</clickhouse>

此磁盘声明相关的完整设置列表可以在此处找到。

创建表格

假设您已配置磁盘以使用具有写入访问权限的存储桶，您应该能够创建如下示例中的表格。为了简洁起见，我们使用 NYC 出租车列的子集，并将数据直接流式传输到基于 GCS 的表中：

CREATE TABLE trips_gcs
(
   `trip_id` UInt32,
   `pickup_date` Date,
   `pickup_datetime` DateTime,
   `dropoff_datetime` DateTime,
   `pickup_longitude` Float64,
   `pickup_latitude` Float64,
   `dropoff_longitude` Float64,
   `dropoff_latitude` Float64,
   `passenger_count` UInt8,
   `trip_distance` Float64,
   `tip_amount` Float32,
   `total_amount` Float32,
   `payment_type` Enum8('UNK' = 0, 'CSH' = 1, 'CRE' = 2, 'NOC' = 3, 'DIS' = 4)
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(pickup_date)
ORDER BY pickup_datetime
-- highlight-next-line
SETTINGS storage_policy='gcs_main'

INSERT INTO trips_gcs SELECT trip_id, pickup_date, pickup_datetime, dropoff_datetime, pickup_longitude, pickup_latitude, dropoff_longitude, dropoff_latitude, passenger_count, trip_distance, tip_amount, total_amount, payment_type FROM s3('https://ch-nyc-taxi.s3.eu-west-3.amazonaws.com/tsv/trips_{0..9}.tsv.gz', 'TabSeparatedWithNames') LIMIT 1000000;

根据硬件情况，最后插入 1M 行的数据可能需要几分钟才能执行。您可以通过 system.processes 表确认进度。可以根据限制将行数调整至 10M，并探索一些示例查询。

SELECT passenger_count, avg(tip_amount) AS avg_tip, avg(total_amount) AS avg_amount FROM trips_gcs GROUP BY passenger_count;

处理复制

可以通过使用 ReplicatedMergeTree 表引擎来实现与 GCS 磁盘的复制。有关详细信息，请参见使用 GCS 在两个 GCP 区域间复制单个分片指南。

了解更多信息

Cloud Storage XML API 与一些处理 Amazon 简单存储服务（Amazon S3）等服务的工具和库是互操作的。

有关调优线程的更多信息，请参阅优化性能。

使用 Google Cloud Storage (GCS)

提示

在 ClickHouse Cloud 中默认使用对象存储，如果您在 ClickHouse Cloud 中运行，则无需遵循此过程。

规划部署

本教程旨在描述在 Google Cloud 中运行的复制 ClickHouse 部署，并将 Google Cloud Storage (GCS) 用作 ClickHouse 存储磁盘“类型”。

在本教程中，您将在 Google Cloud Engine VM 中部署 ClickHouse 服务器节点，每个节点都有一个关联的 GCS 存储桶。复制由一组 ClickHouse Keeper 节点协调，这些节点也作为 VM 部署。

高可用性的示例要求：

两个 ClickHouse 服务器节点，在两个 GCP 区域
两个 GCS 存储桶，部署在与两个 ClickHouse 服务器节点相同的区域
三个 ClickHouse Keeper 节点，其中两个部署在与 ClickHouse 服务器节点相同的区域。第三个可以与前两个 Keeper 节点中的一个位于相同区域，但在不同的可用区。

ClickHouse Keeper 需要两个节点才能运行，因此需要三个节点以实现高可用性。

准备虚拟机

在三个区域中部署五个虚拟机：

区域	ClickHouse 服务器	存储桶	ClickHouse Keeper
1	`chnode1`	`bucket_regionname`	`keepernode1`
2	`chnode2`	`bucket_regionname`	`keepernode2`
3 `*`			`keepernode3`

* 这可以是与 1 或 2 位于相同区域的不同可用区。

部署 ClickHouse

在两个主机上部署 ClickHouse，在示例配置中这些主机被命名为 chnode1、chnode2。

将 chnode1 放置在一个 GCP 区域，将 chnode2 放置在第二个区域。在本指南中，us-east1 和 us-east4 用于计算引擎 VM，也用于 GCS 存储桶。

备注

在配置完成之前，请勿启动 clickhouse server。请先安装它。

在 ClickHouse 服务器节点执行部署步骤时，请参考安装说明。

部署 ClickHouse Keeper

在三个主机上部署 ClickHouse Keeper，在示例配置中这些主机被命名为 keepernode1、keepernode2 和 keepernode3。可以将 keepernode1 部署在与 chnode1 相同的区域，将 keepernode2 部署在与 chnode2 相同的区域，而 keepernode3 可以在任何区域，但必须与该区域中的 ClickHouse 节点位于不同的可用区。

在对 ClickHouse Keeper 节点执行部署步骤时，请参考安装说明。

创建两个存储桶

为了实现高可用性，两个 ClickHouse 服务器将位于不同的区域。每个服务器将在相同区域内拥有一个 GCS 存储桶。

在 Cloud Storage > Buckets 中选择 CREATE BUCKET。在本教程中创建两个存储桶，一个在 us-east1，另一个在 us-east4。存储桶是单区域的，标准存储类别，并且不是公共的。当提示时，启用公共访问预防。请勿创建文件夹，这些文件夹将在 ClickHouse 写入存储时创建。

如果您需要逐步指导以创建存储桶和 HMAC 密钥，请展开 创建 GCS 存储桶和 HMAC 密钥 并按照步骤操作：

创建 GCS 存储桶和 HMAC 密钥

ch_bucket_us_east1

ch_bucket_us_east4

生成访问密钥

创建服务账号 HMAC 密钥和秘密

打开 Cloud Storage > 设置 > 互操作性，然后选择现有的 访问密钥，或者 为服务账号创建密钥。本指南涵盖为新服务账号创建新密钥的路径。

添加新服务账号

如果这是一个没有现有服务账号的项目，请 创建新账号。

创建服务账号有三个步骤。在第一步中，给账号一个有意义的名称、ID 和描述。

在互操作性设置对话框中，推荐 IAM 角色 存储对象管理员 角色；在第二步中选择该角色。

第三步是可选的，本指南中未使用。您可以根据您的策略允许用户具有这些权限。

服务账号 HMAC 密钥将会显示。请保存这些信息，因为它将在 ClickHouse 配置中使用。

配置 ClickHouse Keeper

所有 ClickHouse Keeper 节点都具有相同的配置文件，唯一的区别是 server_id 行（下方第一个高亮的行）。修改文件以包含 ClickHouse Keeper 服务器的主机名，并在每个服务器上将 server_id 设置为与 raft_configuration 中的相应 server 条目匹配。由于此示例将 server_id 设置为 3，我们已在 raft_configuration 中高亮显示了匹配的行。

使用您的主机名编辑文件，并确保从 ClickHouse 服务器节点和 Keeper 节点解析这些主机名
将文件复制到相应位置（在每个 Keeper 服务器上的 /etc/clickhouse-keeper/keeper_config.xml）
根据其在 raft_configuration 中的条目编号编辑每台机器上的 server_id

<clickhouse>
    <logger>
        <level>trace</level>
        <log>/var/log/clickhouse-keeper/clickhouse-keeper.log</log>
        <errorlog>/var/log/clickhouse-keeper/clickhouse-keeper.err.log</errorlog>
        <size>1000M</size>
        <count>3</count>
    </logger>
    <listen_host>0.0.0.0</listen_host>
    <keeper_server>
        <tcp_port>9181</tcp_port>
<!--highlight-next-line-->
        <server_id>3</server_id>
        <log_storage_path>/var/lib/clickhouse/coordination/log</log_storage_path>
        <snapshot_storage_path>/var/lib/clickhouse/coordination/snapshots</snapshot_storage_path>

        <coordination_settings>
            <operation_timeout_ms>10000</operation_timeout_ms>
            <session_timeout_ms>30000</session_timeout_ms>
            <raft_logs_level>warning</raft_logs_level>
        </coordination_settings>

        <raft_configuration>
            <server>
                <id>1</id>
                <hostname>keepernode1.us-east1-b.c.clickhousegcs-374921.internal</hostname>
                <port>9234</port>
            </server>
            <server>
                <id>2</id>
                <hostname>keepernode2.us-east4-c.c.clickhousegcs-374921.internal</hostname>
                <port>9234</port>
            </server>
<!--highlight-start-->
            <server>
                <id>3</id>
                <hostname>keepernode3.us-east5-a.c.clickhousegcs-374921.internal</hostname>
                <port>9234</port>
            </server>
<!--highlight-end-->
        </raft_configuration>
    </keeper_server>
</clickhouse>

配置 ClickHouse 服务器

最佳实践

本指南中的某些步骤会要求您将配置文件放置在 /etc/clickhouse-server/config.d/ 中。这是 Linux 系统上默认的配置覆盖文件位置。将这些文件放入该目录后，ClickHouse 将与默认配置合并内容。通过将这些文件放入 config.d 目录，您可以避免在升级期间丢失配置。

网络配置

默认情况下，ClickHouse 在回环接口上监听，在复制设置中，机器之间需要进行网络连接。监听所有接口：

<clickhouse>
    <listen_host>0.0.0.0</listen_host>
</clickhouse>

远程 ClickHouse Keeper 服务器

复制由 ClickHouse Keeper 协调。此配置文件通过主机名和端口号标识 ClickHouse Keeper 节点。

编辑主机名以与您的 Keeper 主机匹配

<clickhouse>
    <zookeeper>
        <node index="1">
            <host>keepernode1.us-east1-b.c.clickhousegcs-374921.internal</host>
            <port>9181</port>
        </node>
        <node index="2">
            <host>keepernode2.us-east4-c.c.clickhousegcs-374921.internal</host>
            <port>9181</port>
        </node>
        <node index="3">
            <host>keepernode3.us-east5-a.c.clickhousegcs-374921.internal</host>
            <port>9181</port>
        </node>
    </zookeeper>
</clickhouse>

远程 ClickHouse 服务器

此文件配置群集中每个 ClickHouse 服务器的主机名和端口。默认配置文件包含示例集群定义，为了仅显示完全配置的集群，标签 replace="true" 被添加到 remote_servers 条目中，以便当此配置与默认配置合并时，它替换 remote_servers 部分，而不是添加到其中。

编辑文件以匹配您的主机名，并确保从 ClickHouse 服务器节点解析这些主机名

<clickhouse>
    <remote_servers replace="true">
        <cluster_1S_2R>
            <shard>
                <replica>
                    <host>chnode1.us-east1-b.c.clickhousegcs-374921.internal</host>
                    <port>9000</port>
                </replica>
                <replica>
                    <host>chnode2.us-east4-c.c.clickhousegcs-374921.internal</host>
                    <port>9000</port>
                </replica>
            </shard>
        </cluster_1S_2R>
    </remote_servers>
</clickhouse>

副本标识

此文件配置与 ClickHouse Keeper 路径相关的设置。具体来说，是用于识别数据属于哪个副本的宏。在一台服务器上，副本应指定为 replica_1，而在另一台服务器上指定为 replica_2。可以更改名称，根据一个副本存储在南卡罗来纳州，另一个存储在北弗吉尼亚州的示例，值可以是 carolina 和 virginia；只需确保每台机器上的名称不同即可。

<clickhouse>
    <distributed_ddl>
            <path>/clickhouse/task_queue/ddl</path>
    </distributed_ddl>
    <macros>
        <cluster>cluster_1S_2R</cluster>
        <shard>1</shard>
<!--highlight-next-line-->
        <replica>replica_1</replica>
    </macros>
</clickhouse>

GCS 中的存储

ClickHouse 的存储配置包括 disks 和 policies。下面配置的磁盘名称为 gcs，并且为 type 为 s3。该类型为 S3，因为 ClickHouse 将 GCS 存储桶视为 AWS S3 存储桶来访问。此配置将需要两个副本，每个 ClickHouse 服务器节点一个。

以下配置中应进行以下替换。

这两个 ClickHouse 服务器节点之间的替换有所不同：

REPLICA 1 BUCKET 应设置为与服务器位于同一区域的存储桶名称
REPLICA 1 FOLDER 应更改为在一台服务器上为 replica_1，在另一台服务器上为 replica_2

这些替换在两个节点中是相同的：

access_key_id 应设置为之前生成的 HMAC 密钥
secret_access_key 应设置为之前生成的 HMAC 密钥

<clickhouse>
    <storage_configuration>
        <disks>
            <gcs>
                <support_batch_delete>false</support_batch_delete>
                <type>s3</type>
                <endpoint>https://storage.googleapis.com/REPLICA 1 BUCKET/REPLICA 1 FOLDER/</endpoint>
                <access_key_id>SERVICE ACCOUNT HMAC KEY</access_key_id>
                <secret_access_key>SERVICE ACCOUNT HMAC SECRET</secret_access_key>
                <metadata_path>/var/lib/clickhouse/disks/gcs/</metadata_path>
            </gcs>
            <cache>
                <type>cache</type>
                <disk>gcs</disk>
                <path>/var/lib/clickhouse/disks/gcs_cache/</path>
                <max_size>10Gi</max_size>
            </cache>
        </disks>
        <policies>
            <gcs_main>
                <volumes>
                    <main>
                        <disk>gcs</disk>
                    </main>
                </volumes>
            </gcs_main>
        </policies>
    </storage_configuration>
</clickhouse>

启动 ClickHouse Keeper

使用与操作系统匹配的命令，例如：

sudo systemctl enable clickhouse-keeper
sudo systemctl start clickhouse-keeper
sudo systemctl status clickhouse-keeper

检查 ClickHouse Keeper 状态

使用 netcat 向 ClickHouse Keeper 发送命令。例如，mntr 返回 ClickHouse Keeper 集群的状态。如果您在每个 Keeper 节点上运行此命令，您将看到一个是领导者，其他两个是跟随者：

echo mntr | nc localhost 9181

zk_version      v22.7.2.15-stable-f843089624e8dd3ff7927b8a125cf3a7a769c069
zk_avg_latency  0
zk_max_latency  11
zk_min_latency  0
zk_packets_received     1783
zk_packets_sent 1783

# highlight-start
zk_num_alive_connections        2
zk_outstanding_requests 0
zk_server_state leader

# highlight-end
zk_znode_count  135
zk_watch_count  8
zk_ephemerals_count     3
zk_approximate_data_size        42533
zk_key_arena_size       28672
zk_latest_snapshot_size 0
zk_open_file_descriptor_count   182
zk_max_file_descriptor_count    18446744073709551615

# highlight-start
zk_followers    2
zk_synced_followers     2

# highlight-end

启动 ClickHouse 服务器

在 chnode1 和 chnode2 上运行：

sudo service clickhouse-server start

sudo service clickhouse-server status

验证

验证磁盘配置

system.disks 应包含每个磁盘的记录：

default
gcs
cache

SELECT *
FROM system.disks
FORMAT Vertical

Row 1:
──────
name:             cache
path:             /var/lib/clickhouse/disks/gcs/
free_space:       18446744073709551615
total_space:      18446744073709551615
unreserved_space: 18446744073709551615
keep_free_space:  0
type:             s3
is_encrypted:     0
is_read_only:     0
is_write_once:    0
is_remote:        1
is_broken:        0
cache_path:       /var/lib/clickhouse/disks/gcs_cache/

Row 2:
──────
name:             default
path:             /var/lib/clickhouse/
free_space:       6555529216
total_space:      10331889664
unreserved_space: 6555529216
keep_free_space:  0
type:             local
is_encrypted:     0
is_read_only:     0
is_write_once:    0
is_remote:        0
is_broken:        0
cache_path:

Row 3:
──────
name:             gcs
path:             /var/lib/clickhouse/disks/gcs/
free_space:       18446744073709551615
total_space:      18446744073709551615
unreserved_space: 18446744073709551615
keep_free_space:  0
type:             s3
is_encrypted:     0
is_read_only:     0
is_write_once:    0
is_remote:        1
is_broken:        0
cache_path:

3 rows in set. Elapsed: 0.002 sec.

验证集群中创建的表在两个节点上均已创建

-- highlight-next-line
create table trips on cluster 'cluster_1S_2R' (
 `trip_id` UInt32,
 `pickup_date` Date,
 `pickup_datetime` DateTime,
 `dropoff_datetime` DateTime,
 `pickup_longitude` Float64,
 `pickup_latitude` Float64,
 `dropoff_longitude` Float64,
 `dropoff_latitude` Float64,
 `passenger_count` UInt8,
 `trip_distance` Float64,
 `tip_amount` Float32,
 `total_amount` Float32,
 `payment_type` Enum8('UNK' = 0, 'CSH' = 1, 'CRE' = 2, 'NOC' = 3, 'DIS' = 4))
ENGINE = ReplicatedMergeTree
PARTITION BY toYYYYMM(pickup_date)
ORDER BY pickup_datetime
-- highlight-next-line
SETTINGS storage_policy='gcs_main'

┌─host───────────────────────────────────────┬─port─┬─status─┬─error─┬─num_hosts_remaining─┬─num_hosts_active─┐
│ chnode2.us-east4-c.c.gcsqa-375100.internal │ 9000 │      0 │       │                   1 │                1 │
└────────────────────────────────────────────┴──────┴────────┴───────┴─────────────────────┴──────────────────┘
┌─host───────────────────────────────────────┬─port─┬─status─┬─error─┬─num_hosts_remaining─┬─num_hosts_active─┐
│ chnode1.us-east1-b.c.gcsqa-375100.internal │ 9000 │      0 │       │                   0 │                0 │
└────────────────────────────────────────────┴──────┴────────┴───────┴─────────────────────┴──────────────────┘

2 rows in set. Elapsed: 0.641 sec.

验证数据可以被插入

INSERT INTO trips SELECT
    trip_id,
    pickup_date,
    pickup_datetime,
    dropoff_datetime,
    pickup_longitude,
    pickup_latitude,
    dropoff_longitude,
    dropoff_latitude,
    passenger_count,
    trip_distance,
    tip_amount,
    total_amount,
    payment_type
FROM s3('https://ch-nyc-taxi.s3.eu-west-3.amazonaws.com/tsv/trips_{0..9}.tsv.gz', 'TabSeparatedWithNames')
LIMIT 1000000

验证表中使用存储策略 `gcs_main`。

SELECT
    engine,
    data_paths,
    metadata_path,
    storage_policy,
    formatReadableSize(total_bytes)
FROM system.tables
WHERE name = 'trips'
FORMAT Vertical

Row 1:
──────
engine:                          ReplicatedMergeTree
data_paths:                      ['/var/lib/clickhouse/disks/gcs/store/631/6315b109-d639-4214-a1e7-afbd98f39727/']
metadata_path:                   /var/lib/clickhouse/store/e0f/e0f3e248-7996-44d4-853e-0384e153b740/trips.sql
storage_policy:                  gcs_main
formatReadableSize(total_bytes): 36.42 MiB

1 row in set. Elapsed: 0.002 sec.

在 Google Cloud 控制台中进行验证

查看存储桶，您将看到在每个存储桶中创建了一个文件夹，其名称与 storage.xml 配置文件中使用的名称相同。展开这些文件夹，您将看到许多文件，代表数据分区。

副本一的存储桶

在 Google Cloud Storage 中显示带有数据分区的文件夹结构的副本一存储桶

副本二的存储桶

在 Google Cloud Storage 中显示带有数据分区的文件夹结构的副本二存储桶

GCS 支持的 MergeTree​

创建磁盘​

存储配置 > 磁盘 > gcs​

存储配置 > 磁盘 > 缓存​

存储配置 > 策略 > gcs_main​

创建表格​

处理复制​

了解更多信息​

使用 Google Cloud Storage (GCS)​

规划部署​

准备虚拟机​

部署 ClickHouse​

部署 ClickHouse Keeper​

创建两个存储桶​

ch_bucket_us_east1​

ch_bucket_us_east4​

生成访问密钥​

创建服务账号 HMAC 密钥和秘密​

添加新服务账号​

配置 ClickHouse Keeper​

配置 ClickHouse 服务器​

网络配置​

远程 ClickHouse Keeper 服务器​

远程 ClickHouse 服务器​

副本标识​

GCS 中的存储​

启动 ClickHouse Keeper​

检查 ClickHouse Keeper 状态​

启动 ClickHouse 服务器​

验证​

验证磁盘配置​

验证集群中创建的表在两个节点上均已创建​

验证数据可以被插入​

验证表中使用存储策略 gcs_main。​

在 Google Cloud 控制台中进行验证​

副本一的存储桶​

副本二的存储桶​