跳转到主内容
跳转到主内容

上线生产环境

在生产环境部署 ClickStack 时,为确保安全性、稳定性以及正确配置,还需要额外考虑若干事项。这些事项会因所使用的分发方式——开源或托管——而有所不同。

对于生产环境部署,推荐使用 Managed ClickStack。它默认采用业界标准的安全实践,包括增强的加密、身份验证与连接能力以及托管访问控制,并同时提供以下优势:

  • 计算资源可独立于存储自动伸缩
  • 基于对象存储的低成本且几乎无限的数据保留能力
  • 能够使用 Warehouses 将读写工作负载进行独立隔离
  • 集成身份验证
  • 自动化备份
  • 无缝升级

在使用 Managed ClickStack 时,请遵循适用于 ClickHouse Cloud 的这些最佳实践

保护摄取安全

默认情况下,当在开源发行版之外部署时,ClickStack OpenTelemetry Collector 未进行安全加固,并且在其 OTLP 端口上不要求身份验证。

要实现安全摄取,请在使用 OTLP_AUTH_TOKEN 环境变量部署 collector 时指定身份验证令牌。有关更多详细信息,请参见“Securing the collector”

创建摄取用户

建议为 OTel collector 创建一个专用用户,用于向 Managed ClickHouse 进行摄取,并确保摄取数据被发送到特定的数据库,例如 otel。有关更多详细信息,请参见“Creating an ingestion user”

配置生存时间 (TTL)

请确保为你的 Managed ClickStack 部署生存时间 (TTL)进行了适当配置。这将控制数据的保留时长——默认值为 3 天,通常需要进行调整。

资源估算

在部署 Managed ClickStack 时,必须预留足够的计算资源来同时处理摄取和查询工作负载。下述估算基于你计划摄取的可观测性数据量,提供一个基准起点

这些建议基于以下假设:

  • 数据量是指每月的未压缩摄取量,适用于日志和追踪。
  • 查询模式是典型的可观测性用例,大多数查询针对最近的数据,通常是过去 24 小时。
  • 摄取在整个月内相对均匀。如果预计会有突发流量或峰值,应预留额外余量。
  • 存储通过 ClickHouse Cloud 对象存储单独处理,不会对保留时长构成限制。我们假设长时间保留的数据被访问的频率较低。

对于经常查询长时间范围、执行重型聚合或需要支持大量并发用户的访问模式,可能需要更多计算资源。

每月摄取量推荐计算资源
< 10 TB / month2 vCPU × 3 个副本
10–50 TB / month4 vCPU × 3 个副本
50–100 TB / month8 vCPU × 3 个副本
100–500 TB / month30 vCPU × 3 个副本
1 PB+ / month59 vCPU × 3 个副本
注意

这些数值仅为估算值,应作为初始基线使用。实际需求取决于查询复杂度、并发度、保留策略以及摄取吞吐量的波动情况。请始终监控资源使用情况,并按需扩缩容。

隔离可观测性工作负载

如果你在一个已经支持其他工作负载(例如实时应用分析)的现有 ClickHouse Cloud 服务中新增 ClickStack,强烈建议将可观测性流量进行隔离。

使用 Managed Warehouses 创建一个专用于 ClickStack 的子服务。这样可以:

  • 将摄取和查询负载与现有应用相互隔离
  • 独立扩缩可观测性工作负载
  • 防止可观测性查询影响生产分析
  • 在需要时在服务之间共享相同的底层数据集

这种方式可以确保你现有的工作负载不受影响,同时允许 ClickStack 随着可观测性数据的增长而独立伸缩。

对于更大规模的部署或定制规格建议,请联系支持以获取更精确的评估。