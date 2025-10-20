使用 ClickStack 监控 Redis 指标

TL;DR 本指南演示如何通过配置 OpenTelemetry collector 的 Redis receiver，使用 ClickStack 监控 Redis 性能指标。你将学会如何： 配置 OTel collector 来采集 Redis 指标

使用自定义配置部署 ClickStack

使用预置仪表板可视化 Redis 性能（commands/sec、内存使用、已连接客户端、缓存性能） 如果你希望在为生产环境 Redis 配置集成之前进行测试，可以使用提供的包含示例指标的演示数据集。 预计耗时：5–10 分钟

本节介绍如何通过为 ClickStack OTel collector 配置 Redis receiver，将你现有的 Redis 实例配置为向 ClickStack 发送指标数据。

如果你希望在为自己的现有环境进行配置之前先测试 Redis 指标集成，可以使用我们预配置的演示数据集进行测试，详见下一节。

正在运行的 ClickStack 实例

已部署的 Redis（版本 3.0 或更高）

ClickStack 到 Redis 的网络连通性（默认端口 6379）

如果启用了身份验证，则需要 Redis 密码

验证 Redis 连接 首先,验证您可以连接到 Redis 且 INFO 命令能够正常运行: # 测试连接 redis-cli ping # 预期输出：PONG # 测试 INFO 命令（由指标采集器使用） redis-cli INFO server # 应显示 Redis 服务器信息 如果 Redis 需要身份验证: redis-cli -a <your-password> ping 常见 Redis 端点： 本地实例 ： localhost:6379

： Docker ：使用容器名或服务名（例如 redis:6379 ）

：使用容器名或服务名（例如 ） 远程: <redis-host>:6379 创建自定义 OTel collector 配置 ClickStack 允许您通过挂载自定义配置文件并设置环境变量来扩展 OpenTelemetry 采集器的基础配置。自定义配置会与 HyperDX 通过 OpAMP 管理的基础配置进行合并。 创建一个名为 redis-metrics.yaml 的文件,其中包含以下配置: receivers: redis: endpoint: "localhost:6379" collection_interval: 10s # 如果 Redis 需要身份验证，请取消注释 # password: ${env:REDIS_PASSWORD} # 配置要收集的指标 metrics: redis.commands.processed: enabled: true redis.clients.connected: enabled: true redis.memory.used: enabled: true redis.keyspace.hits: enabled: true redis.keyspace.misses: enabled: true redis.keys.evicted: enabled: true redis.keys.expired: enabled: true processors: resource: attributes: - key: service.name value: "redis" action: upsert service: pipelines: metrics/redis: receivers: [redis] processors: - resource - memory_limiter - batch exporters: - clickhouse 此配置： 连接到 localhost:6379 的 Redis（请根据实际环境调整该端点）

的 Redis（请根据实际环境调整该端点） 每 10 秒采集一次指标

收集关键性能指标（命令、客户端、内存、键空间统计信息）

根据 OpenTelemetry 语义约定 设置必需的 service.name 资源属性

通过专用管道将指标路由到 ClickHouse exporter 收集的关键指标： redis.commands.processed - 每秒处理的命令数量

- 每秒处理的命令数量 redis.clients.connected - 已连接的客户端数量

- 已连接的客户端数量 redis.clients.blocked - 因阻塞式调用而被阻塞的客户端

- 因阻塞式调用而被阻塞的客户端 redis.memory.used - Redis 已使用的内存（以字节为单位）

- Redis 已使用的内存（以字节为单位） redis.memory.peak - 内存峰值使用量

- 内存峰值使用量 redis.keyspace.hits - 键空间命中次数

- 键空间命中次数 redis.keyspace.misses - 键查找失败次数（用于计算缓存命中率）

- 键查找失败次数（用于计算缓存命中率） redis.keys.expired - 过期的键数

- 过期的键数 redis.keys.evicted - 因内存压力被逐出的键数量

- 因内存压力被逐出的键数量 redis.connections.received - 已接收的连接总数

- 已接收的连接总数 redis.connections.rejected - 被拒绝的连接次数 注意 你只需要在自定义配置中定义新的接收器、处理器和管道

在基础 ClickStack 配置中， memory_limiter 和 batch 处理器以及 clickhouse 导出器已经定义好——只需按名称引用它们即可

和 处理器以及 导出器已经定义好——只需按名称引用它们即可 resource 处理器按照 OpenTelemetry 语义约定设置必需的 service.name 属性

处理器按照 OpenTelemetry 语义约定设置必需的 属性 在生产环境中启用认证时，将密码存储在环境变量中： ${env:REDIS_PASSWORD}

根据需要调整 collection_interval （默认为 10s；值越小，数据量越大）

（默认为 10s；值越小，数据量越大） 对于多个 Redis 实例，自定义 service.name 来区分不同实例（例如： "redis-cache" 、 "redis-sessions" ） 配置 ClickStack 加载自定义配置 要在现有的 ClickStack 部署中启用自定义采集器配置，您必须： 将自定义配置文件挂载到 /etc/otelcol-contrib/custom.config.yaml 设置环境变量 CUSTOM_OTELCOL_CONFIG_FILE=/etc/otelcol-contrib/custom.config.yaml 。 确保 ClickStack 与 Redis 之间的网络连接正常 更新您的 ClickStack 部署配置： services: clickstack: # ... 现有配置 ... environment: - CUSTOM_OTELCOL_CONFIG_FILE=/etc/otelcol-contrib/custom.config.yaml # 可选：如果 Redis 需要身份验证 # - REDIS_PASSWORD=your-redis-password # ... 其他环境变量 ... volumes: - ./redis-metrics.yaml:/etc/otelcol-contrib/custom.config.yaml:ro # ... 其他卷 ... # 如果 Redis 在同一个 compose 文件中： depends_on: - redis redis: image: redis:7-alpine ports: - "6379:6379" # 可选：启用身份验证 # command: redis-server --requirepass your-redis-password 如果使用 docker run 运行一体化镜像： docker run --name clickstack \ -p 8080:8080 -p 4317:4317 -p 4318:4318 \ -e CUSTOM_OTELCOL_CONFIG_FILE=/etc/otelcol-contrib/custom.config.yaml \ -v "$(pwd)/redis-metrics.yaml:/etc/otelcol-contrib/custom.config.yaml:ro" \ docker.hyperdx.io/hyperdx/hyperdx-all-in-one:latest 重要提示： 如果 Redis 运行在另一个容器中，请使用 Docker 网络： # 创建网络 docker network create monitoring # 在网络中运行 Redis docker run -d --name redis --network monitoring redis:7-alpine # 在同一网络中运行 ClickStack（在配置中将端点更新为 "redis:6379"） docker run --name clickstack \ --network monitoring \ -p 8080:8080 -p 4317:4317 -p 4318:4318 \ -e CUSTOM_OTELCOL_CONFIG_FILE=/etc/otelcol-contrib/custom.config.yaml \ -v "$(pwd)/redis-metrics.yaml:/etc/otelcol-contrib/custom.config.yaml:ro" \ docker.hyperdx.io/hyperdx/hyperdx-all-in-one:latest 在 HyperDX 中验证指标 配置完成后,登录 HyperDX 并验证指标数据是否正常流入: 转到 Metrics Explorer 搜索以 redis. 开头的指标（例如： redis.commands.processed 、 redis.memory.used ） 你应该会看到指标数据点按你配置的采集间隔开始出现

对于希望在配置生产系统之前先测试 Redis Metrics 集成的用户，我们提供了一个预先生成的数据集，其中包含逼真的 Redis Metrics 行为模式。

下载示例指标数据集 下载预生成的指标文件（包含 24 小时的 Redis Metrics，具有逼真模式）： # 下载 gauge 类型指标（内存、碎片率） \{#expected-output-pong} curl -O https://datasets-documentation.s3.eu-west-3.amazonaws.com/clickstack-integrations/redis/redis-metrics-gauge.csv # 下载 sum 类型指标（命令数、连接数、keyspace 统计） \{#test-info-command-used-by-metrics-collector} curl -O https://datasets-documentation.s3.eu-west-3.amazonaws.com/clickstack-integrations/redis/redis-metrics-sum.csv 该数据集包含以下典型模式： 缓存预热事件（06:00） - 命中率从 30% 提升到 80%

- 命中率从 30% 提升到 80% 流量峰值（14:30-14:45） - 流量突增 5 倍并伴随连接压力

- 流量突增 5 倍并伴随连接压力 内存压力（20:00） - 键被逐出并且缓存性能下降

- 键被逐出并且缓存性能下降 日常流量模式 - 工作时间流量高峰、晚间下降、随机小尖峰 启动 ClickStack 启动一个 ClickStack 实例： docker run -d --name clickstack-demo \ -p 8080:8080 -p 4317:4317 -p 4318:4318 \ docker.hyperdx.io/hyperdx/hyperdx-all-in-one:latest 等待大约 30 秒，直至 ClickStack 完全启动。 将指标加载到 ClickStack 中 将指标直接加载到 ClickHouse 中： # 加载 gauge 类型指标（内存、碎片） cat redis-metrics-gauge.csv | docker exec -i clickstack-demo \ clickhouse-client --query "INSERT INTO otel_metrics_gauge FORMAT CSVWithNames" # 加载 sum 类型指标（命令数、连接数、keyspace） cat redis-metrics-sum.csv | docker exec -i clickstack-demo \ clickhouse-client --query "INSERT INTO otel_metrics_sum FORMAT CSVWithNames" 在 HyperDX 中验证指标 指标加载完成后，最快的查看方式是使用预构建的仪表板。 前往 仪表板与可视化 部分，导入仪表板并一次性查看所有 Redis Metrics。 注意 演示数据集的时间范围为 2025-10-20 00:00:00 至 2025-10-21 05:00:00。请确保你在 HyperDX 中选择的时间范围与该时间窗口一致。 留意以下有代表性的模式： 06:00 - 缓存预热（低命中率逐步上升）

- 缓存预热（低命中率逐步上升） 14:30-14:45 - 流量峰值（高客户端连接数，存在部分拒绝）

- 流量峰值（高客户端连接数，存在部分拒绝） 20:00 - 内存压力（开始出现键逐出）

为了帮助你开始使用 ClickStack 监控 Redis，我们提供了 Redis 指标的基础可视化图表。

下载 仪表板配置 导入预构建的仪表板 打开 HyperDX 并导航到 Dashboards 部分 点击右上角省略号中的 Import Dashboard 上传 redis-metrics-dashboard.json 文件并点击 Finish Import 查看仪表板 系统会创建一个仪表板，并预先配置好所有可视化组件： 注意 对于演示数据集，将时间范围设置为 2025-10-20 05:00:00 - 2025-10-21 05:00:00 (UTC)（可根据你的本地时区进行调整）。导入的仪表板默认不会指定时间范围。

请确认环境变量 CUSTOM_OTELCOL_CONFIG_FILE 是否已正确设置：

docker exec <container-name> printenv CUSTOM_OTELCOL_CONFIG_FILE

检查自定义配置文件是否已挂载在 /etc/otelcol-contrib/custom.config.yaml ：

docker exec <容器名称> ls -lh /etc/otelcol-contrib/custom.config.yaml

查看自定义配置内容，以确认其是否可读：

docker exec <容器名称> cat /etc/otelcol-contrib/custom.config.yaml

验证 collector 是否可以访问 Redis：

# 从 ClickStack 容器中执行 \{#download-sum-metrics-commands-connections-keyspace-stats} docker exec <clickstack-container> redis-cli -h <redis-host> ping # 预期输出：PONG

检查 Redis INFO 命令是否正常工作：

docker exec <clickstack-container> redis-cli -h <redis-host> INFO stats # 应显示 Redis 统计信息

验证当前生效的配置中已包含你的 Redis receiver：

docker exec <容器> cat /etc/otel/supervisor-data/effective.yaml | grep -A 10 "redis:"

检查采集器日志是否有错误：

docker exec <container> cat /etc/otel/supervisor-data/agent.log | grep -i redis # 查找连接错误或认证失败 \{#load-gauge-metrics-memory-fragmentation}

如果您在日志中看到身份验证错误：

# 验证 Redis 是否要求身份验证 redis-cli CONFIG GET requirepass # 测试身份验证 redis-cli -a <password> ping # 确保在 ClickStack 环境中已设置密码 docker exec <clickstack-container> printenv REDIS_PASSWORD

更新您的配置以使用此密码：

receivers: redis: endpoint: "redis:6379" password: ${env:REDIS_PASSWORD}

如果 ClickStack 无法访问 Redis：

# 检查两个容器是否在同一网络上 docker network inspect <network-name> # 测试连通性 docker exec <clickstack-container> ping redis docker exec <clickstack-container> telnet redis 6379

确保在 Docker Compose 文件或 docker run 命令中，将这两个容器加入同一网络。

如果想进一步探索，可以通过以下方式继续改进和试验监控配置：