将 EMQX 与 ClickHouse 集成
连接 EMQX
EMQX 是一个开源的 MQTT 代理,具有高性能的实时消息处理引擎,支持大规模物联网设备的事件流。作为最具可扩展性的 MQTT 代理,EMQX 可以帮助您以任何规模连接任何设备。随时随地移动和处理您的物联网数据。
EMQX Cloud 是一个为物联网领域提供的 MQTT 消息中间件产品,由 EMQ 托管。作为全球首个全托管的 MQTT 5.0 云消息服务,EMQX Cloud 提供一站式运维共址和独特的隔离环境,为 MQTT 消息服务提供支持。在万物互联的时代,EMQX Cloud 可以帮助您快速构建物联网领域的行业应用,并轻松收集、传输、计算和持久化物联网数据。
借助云服务提供商提供的基础设施,EMQX Cloud 服务覆盖全球多个国家和地区,为 5G 和万物互联应用提供低成本、安全和可靠的云服务。

假设
- 您熟悉 MQTT 协议,该协议被设计为极为轻量的发布/订阅消息传输协议。
- 您正在使用 EMQX 或 EMQX Cloud 作为实时消息处理引擎,支持大规模物联网设备的事件流。
- 您已准备好 Clickhouse Cloud 实例以持久化设备数据。
- 我们使用 MQTT X 作为 MQTT 客户端测试工具,将 EMQX Cloud 的部署连接以发布 MQTT 数据。或其他连接到 MQTT 代理的方法也可以完成此任务。
获取 ClickHouse Cloud 服务
在这个设置过程中,我们在 AWS 的弗吉尼亚州北部(us-east-1)部署了 ClickHouse 实例,同时在同一区域也部署了 EMQX Cloud 实例。

在设置过程中,您还需要注意连接设置。在本教程中,我们选择 “Anywhere”,但如果您申请特定位置,您需要将从 EMQX Cloud 部署中获得的 NAT 网关 IP 地址添加到白名单中。

然后,您需要保存您的用户名和密码以供将来使用。

之后,您将得到一个运行中的 Clickhouse 实例。单击 "Connect" 以获取 Clickhouse Cloud 的实例连接地址。

单击 "Connect to SQL Console" 以创建数据库和表以与 EMQX Cloud 集成。

您可以参考以下 SQL 语句,或根据实际情况修改 SQL。

在 EMQX Cloud 上创建 MQTT 服务
在 EMQX Cloud 上创建专用 MQTT 代理就像点击几下按钮一样简单。
获取账户
EMQX Cloud 为每个账户提供 14 天的免费试用,无论是标准部署还是专业部署。
如果您是 EMQX Cloud 的新用户,请访问 EMQX Cloud 注册 页面点击开始免费试用以注册账户。

创建 MQTT 集群
登录后,单击账户菜单下的 "Cloud console",您将看到创建新部署的绿色按钮。

在本教程中,我们将使用专业部署,因为只有 Pro 版本提供数据集成功能,可以直接将 MQTT 数据发送到 ClickHouse 而无需编写一行代码。
选择 Pro 版本并选择 N.Virginial
区域,然后单击 Create Now
。在几分钟内,您将获得一个完全托管的 MQTT 代理:

现在单击面板以进入集群视图。在此仪表板上,您将看到 MQTT 代理的概述。

添加客户端凭据
EMQX Cloud 默认不允许匿名连接,因此您需要添加客户端凭据,以便可以使用 MQTT 客户端工具向此代理发送数据。
单击左侧菜单中的 'Authentication & ACL',然后在子菜单中单击 'Authentication'。单击右侧的 'Add' 按钮,为稍后的 MQTT 连接提供用户名和密码。在这里,我们将使用 emqx
和 xxxxxx
作为用户名和密码。

单击 'Confirm',现在我们有一个准备好的完全托管的 MQTT 代理。
启用 NAT 网关
在开始设置 ClickHouse 集成之前,我们需要先启用 NAT 网关。默认情况下,MQTT 代理部署在一个私有 VPC 中,无法通过公共网络向第三方系统发送数据。
返回概述页面,向下滚动到页面底部,您会看到 NAT 网关小部件。单击 "Subscribe" 按钮并按照说明进行操作。请注意,NAT 网关是一项增值服务,但它也提供 14 天的免费试用。

创建完成后,您会在小部件中找到公共 IP 地址。请注意,如果您在 ClickHouse Cloud 设置期间选择 "Connect from a specific location",则需要将此 IP 地址添加到白名单中。
集成 EMQX Cloud 与 ClickHouse Cloud
EMQX Cloud 数据集成 用于配置处理和响应 EMQX 消息流和设备事件的规则。数据集成不仅提供清晰灵活的“可配置”架构解决方案,还简化了开发过程,提高了用户的可用性,并减少了业务系统与 EMQX Cloud 之间的耦合度。它还为自定义 EMQX Cloud 的专有功能提供了卓越的基础设施。

EMQX Cloud 提供与流行数据系统的 30 多种原生集成。ClickHouse 是其中之一。

创建 ClickHouse 资源
单击左侧菜单中的 "Data Integrations",然后单击 "View All Resources"。您将在数据持久化部分找到 ClickHouse,或者您可以搜索 ClickHouse。
单击 ClickHouse 卡片以创建新资源。
- 注:为此资源添加注释。
- 服务器地址:这是您的 ClickHouse Cloud 服务的地址,记得不要忘记端口。
- 数据库名称:
emqx
(我们在上述步骤中创建的)。 - 用户:连接到您的 ClickHouse Cloud 服务的用户名。
- 密钥:连接的密码。

创建新规则
在创建资源的过程中,您会看到一个弹出窗口,点击 'New' 将引导您进入规则创建页面。
EMQX 提供一个强大的 规则引擎,可以在将原始 MQTT 消息发送到第三方系统之前对其进行转换和丰富。
这是本教程中使用的规则:
它将从 temp_hum/emqx
主题读取消息,并通过添加 client_id、主题和时间戳信息来丰富 JSON 对象。
因此,您发送到该主题的原始 JSON:

您可以使用 SQL 测试来测试并查看结果。

现在单击 "NEXT" 按钮。此步骤的目的是告诉 EMQX Cloud 如何将精炼数据插入到您的 ClickHouse 数据库中。
添加响应动作
如果您只有一个资源,则无需修改 'Resource' 和 'Action Type'。 您只需设置 SQL 模板。这是本教程中使用的示例:

这是插入数据到 Clickhouse 的模板,您可以看到这里使用了变量。
查看规则详细信息
单击 "Confirm" 和 "View Details"。现在,一切应该都已设置好。您可以在规则详细信息页面查看数据集成的工作情况。

所有发送到 temp_hum/emqx
主题的 MQTT 消息将在您的 ClickHouse Cloud 数据库中持久化。
将数据保存到 ClickHouse
我们将模拟温度和湿度数据,并通过 MQTT X 将这些数据报告给 EMQX Cloud,然后使用 EMQX Cloud 数据集成将数据保存到 ClickHouse Cloud。

向 EMQX Cloud 发布 MQTT 消息
您可以使用任何 MQTT 客户端或 SDK 发布消息。在本教程中,我们将使用 MQTT X,这是 EMQ 提供的用户友好的 MQTT 客户端应用程序。

在 MQTTX 中单击 "New Connection",填写连接表单:
- 名称:连接名称。使用任何您想要的名称。
- 主机:MQTT 代理连接地址。您可以从 EMQX Cloud 概述页面获取。
- 端口:MQTT 代理连接端口。您可以从 EMQX Cloud 概述页面获取。
- 用户名/密码:使用上面创建的凭据,这在本教程中应该是
emqx
和xxxxxx
。

单击右上角的 "Connect" 按钮,连接应当建立。
现在您可以使用此工具向 MQTT 代理发送消息。 输入:
- 将有效负载格式设置为 "JSON"。
- 设置主题:
temp_hum/emqx
(我们刚在规则中设置的主题) - JSON主体:
单击右侧的发送按钮。您可以更改温度值并向 MQTT 代理发送更多数据。
发送到 EMQX Cloud 的数据应通过规则引擎进行处理,并自动插入到 ClickHouse Cloud。

查看规则监控
检查规则监控,并增加成功的数量。

检查持久化数据
现在是时候查看 ClickHouse Cloud 上的数据了。理想情况下,您使用 MQTTX 发送的数据将经过 EMQX Cloud,并借助原生数据集成持久化到 ClickHouse Cloud 的数据库中。
您可以连接到 ClickHouse Cloud 面板上的 SQL 控制台,或使用任何客户端工具从 ClickHouse 中提取数据。在本教程中,我们使用了 SQL 控制台。 执行 SQL:

总结
您没有编写任何代码,现在 MQTT 数据已经从 EMQX Cloud 移动到 ClickHouse Cloud。借助 EMQX Cloud 和 ClickHouse Cloud,您无需管理基础设施,只需专注于编写您的物联网应用程序,并将数据安全地存储在 ClickHouse Cloud 中。