Helm 云部署(v1.x)
本指南介绍了在托管 Kubernetes 服务上部署 ClickStack 的云环境专用配置。有关基础安装,请参见 Helm 部署主指南。
Google Kubernetes Engine (GKE)
部署到 GKE 时,由于云环境特有的网络行为,你可能需要重写某些值。
LoadBalancer DNS 解析问题
GKE 的 LoadBalancer 服务可能会导致内部 DNS 解析问题,使 pod (容器组) 之间的通信被解析到外部 IP,而不是保留在集群网络内部。这会特别影响 OTel collector 与 OpAMP 服务器之间的连接。
症状:
- OTel collector 日志中显示带有集群 IP 地址的“connection refused”错误
- OpAMP 连接失败,例如:
dial tcp 34.118.227.30:4320: connect: connection refused
解决方案:
对 OpAMP 服务器 URL 使用完全限定域名 (FQDN) :
其他 GKE 相关注意事项
Amazon EKS
对于 EKS 部署,可参考以下常见配置:
Azure AKS
对于 AKS 部署:
生产环境 Cloud 部署检查清单
在任何云服务商上将 ClickStack 部署到生产环境之前:
- 使用外部域名/IP 正确配置
frontendUrl - 搭建启用 TLS 的入口,以提供 HTTPS 访问
- 如果遇到连接问题 (尤其是在 GKE 上) ,请将
otel.opampServerUrl重写为 FQDN - 根据你的 pod (容器组) 网络 CIDR 调整
clickhouse.config.clusterCidrs - 为生产工作负载配置持久化存储
- 设置适当的资源请求和限制
- 启用监控和告警
- 配置备份和灾难恢复
- 实现适当的密钥管理
生产环境最佳实践
资源管理
高可用性
持久化存储
确保已配置用于数据持久化的持久卷:
云环境专用存储类:
- GKE:
pd-ssd或pd-balanced - EKS:
gp3或io2 - AKS:
managed-premium或managed-csi
浏览器兼容性说明
对于仅使用 HTTP 的部署 (开发/测试环境) ,由于安全上下文要求,某些浏览器可能会报出 crypto API 错误。对于生产环境部署,请始终通过入口配置使用带有有效 TLS 证书的 HTTPS。
有关 TLS 设置说明,请参阅入口配置。
后续步骤
- 配置指南 (v1.x) - API 密钥、Secret 和入口
- 部署选项 (v1.x) - 外部系统配置
- Helm 主指南 (v1.x) - 基本安装
- Cloud 部署 (v2.x) - v2.x Cloud 指南
- 升级指南 - 从 v1.x 迁移到 v2.x