Aurora MySQL 源设置指南
本分步指南展示了如何配置 Amazon Aurora MySQL 将数据复制到 ClickHouse Cloud,使用 MySQL ClickPipe。有关 MySQL CDC 的常见问题,请参见 MySQL 常见问题页面。
启用二进制日志保留
二进制日志是一组包含有关对 MySQL 服务器实例进行的数据修改的信息的日志文件,二进制日志文件是复制所必需的。要在 Aurora MySQL 中配置二进制日志保留,您必须 启用二进制日志记录 和 增加 binlog 保留间隔。
1. 通过自动备份启用二进制日志
自动备份功能决定了 MySQL 是否启用二进制日志。可以在 RDS 控制台为您的实例配置自动备份,导航到 修改 > 附加配置 > 备份,然后选择 启用自动备份 复选框(如果尚未选择)。

我们建议根据复制用例将 备份保留期 设置为一个相对较长的值。
2. 增加 binlog 保留间隔
如果 ClickPipes 尝试恢复复制,而所需的 binlog 文件由于配置的 binlog 保留值而被清除,则 ClickPipe 将进入错误状态,需要重新同步。
默认情况下,Aurora MySQL 会尽快清除二进制日志(即,惰性清除)。我们建议将 binlog 保留间隔增加到至少 72 小时,以确保在故障场景下可用的二进制日志文件。要设置 binlog 保留间隔 (binlog retention hours
),请使用 mysql.rds_set_configuration
过程:
如果未设置此配置或设置为较低的间隔,可能会导致二进制日志中的间隙,从而影响 ClickPipes 恢复复制的能力。
配置 binlog 设置
要找到参数组,请在 RDS 控制台中点击您的 MySQL 实例,然后导航到 配置 标签。
如果您有 MySQL 集群,上述参数可以在 DB 集群 参数组中找到,而不是 DB 实例组中。

点击参数组链接,这将带您到其专用页面。您应该会在右上角看到一个 编辑 按钮。

以下参数需要设置如下:
- 将
binlog_format
设置为ROW
。

- 将
binlog_row_metadata
设置为FULL
。

- 将
binlog_row_image
设置为FULL
。

然后,点击右上角的 保存更改。您可能需要重启您的实例才能使更改生效 — 一种知道这一点的方法是在 Aurora 实例的 配置 标签中,您能在参数组链接旁边看到 待重启
。
启用 GTID 模式(推荐)
MySQL ClickPipe 也支持在未启用 GTID 模式的情况下进行复制。然而,建议启用 GTID 模式以获得更好的性能和更容易的故障排除。
全局事务标识符 (GTIDs) 是分配给 MySQL 中每个已提交事务的唯一 ID。它们简化了 binlog 复制,并使故障排除更为简单。我们 建议 启用 GTID 模式,以便 MySQL ClickPipe 可以使用基于 GTID 的复制。
GTID 基于复制支持 Amazon Aurora MySQL v2 (MySQL 5.7) 和 v3 (MySQL 8.0),以及 Aurora Serverless v2。要为您的 Aurora MySQL 实例启用 GTID 模式,请按照以下步骤操作:
- 在 RDS 控制台中,点击您的 MySQL 实例。
- 点击 配置 标签。
- 点击参数组链接。
- 点击右上角的 编辑 按钮。
- 将
enforce_gtid_consistency
设置为ON
。 - 将
gtid-mode
设置为ON
。 - 点击右上角的 保存更改。
- 重启您的实例以使更改生效。

配置数据库用户
以管理员用户身份连接到您的 Aurora MySQL 实例并执行以下命令:
- 为 ClickPipes 创建一个专用用户:
- 授予模式权限。以下示例展示了
mysql
数据库的权限。对每个您想要复制的数据库和主机重复这些命令:
- 授予用户复制权限:
配置网络访问
基于 IP 的访问控制
要限制对您的 Aurora MySQL 实例的流量,请将 记录的静态 NAT IPs 添加到您的 Aurora 安全组的 入站规则。


通过 AWS PrivateLink 的私有访问
要通过私人网络连接到您的 Aurora MySQL 实例,您可以使用 AWS PrivateLink。请遵循 ClickPipes 的 AWS PrivateLink 设置指南 设置连接。
接下来是什么?
现在您的 Amazon Aurora MySQL 实例已配置为 binlog 复制,并安全连接到 ClickHouse Cloud,您可以 创建您的第一个 MySQL ClickPipe。有关 MySQL CDC 的常见问题,请参见 MySQL 常见问题页面。