Helm Cloud 部署
Chart 版本 2.x
本页介绍的是基于子图表的 v2.x Helm 图表。如果你仍在使用 v1.x 内联模板图表,请参阅 Helm Cloud 部署 (v1.x) 。有关迁移步骤,请参阅 升级指南。
本指南介绍了在托管 Kubernetes 服务上部署 ClickStack 时所需的 Cloud 专用配置。有关基本安装,请参阅 Helm 部署主指南。
Google Kubernetes Engine (GKE)
部署到 GKE 时,由于云环境特有的网络行为,您可能需要重写某些配置值。
LoadBalancer DNS 解析问题
GKE 的 LoadBalancer 服务可能会导致内部 DNS 解析异常,使 pod (容器组) 之间的通信被解析到外部 IP,而不是保留在集群网络内部。这会特别影响 OTel collector 与 OpAMP 服务器之间的连接。
症状:
- OTel collector 日志中出现与集群 IP 地址相关的“connection refused”错误
- OpAMP 连接失败,例如:
dial tcp 34.118.227.30:4320: connect: connection refused
解决方案:
对 OpAMP 服务器 URL 使用完全限定域名 (FQDN) :
GKE 示例 Values
Amazon EKS
对于 EKS 部署,可参考以下常见配置:
有关 AWS ALB 入口配置,请参阅附加清单指南以及 ALB 示例 values。
Azure AKS
对于 AKS 的部署:
生产环境云部署检查清单
在任意云服务商上将 ClickStack 部署到生产环境之前:
- 使用外部域名/IP 正确配置
hyperdx.frontendUrl - 配置启用 TLS 的入口,以提供 HTTPS 访问
- 如果遇到连接问题 (尤其是在 GKE 上) ,请使用 FQDN 重写 OpAMP 服务器 URL
- 为 ClickHouse 和 Keeper 的卷声明配置存储类
- 设置适当的资源请求和限制
- 启用监控和告警
- 配置备份和灾难恢复
- 通过
hyperdx.secrets或外部 Secrets 实现适当的机密管理
生产环境最佳实践
资源管理
高可用性
持久化存储
确保已通过 Operator CR 规范配置持久卷,以保留数据:
云平台特定的存储类:
- GKE:
pd-ssd或pd-balanced - EKS:
gp3或io2 - AKS:
managed-premium或managed-csi
浏览器兼容性说明
对于仅使用 HTTP 的部署 (开发/测试) ,由于安全上下文要求,某些浏览器可能会报 crypto API 错误。对于生产环境部署,请始终通过入口配置使用带有有效 TLS 证书的 HTTPS。
有关 TLS 设置说明,请参阅入口配置。