跳到主要内容
跳到主要内容

使用 ClickStack 监控 JVM 指标

摘要

本指南介绍如何使用 ClickStack 结合 OpenTelemetry Java agent 收集指标,从而监控 JVM 应用程序。您将学习如何:

  • 将 OpenTelemetry Java agent 附加到 JVM 应用程序
  • 配置该 agent 通过 OTLP 将指标发送到 ClickStack
  • 使用预构建的仪表板可视化堆内存、垃圾回收、线程和 CPU

如果希望在为生产应用接入监控之前先验证集成效果,可以使用提供的包含示例指标的演示数据集。

所需时间:5–10 分钟

与现有 JVM 应用集成

本节介绍如何配置现有 JVM 应用,通过 OpenTelemetry Java 代理向 ClickStack 发送指标。

如果希望在配置生产环境之前先测试集成效果,可以使用我们的演示数据集进行测试,详情见演示数据集章节

前置条件
  • 已运行的 ClickStack 实例
  • 现有 Java 应用程序(Java 8 及以上)
  • 具有修改 JVM 启动参数的权限

获取 ClickStack API key

OpenTelemetry Java agent 会向 ClickStack 的 OTLP 端点发送数据,该端点需要进行身份验证。

  1. 在你的 ClickStack URL(例如:http://localhost:8080 )打开 HyperDX
  2. 如有需要,创建账号或登录
  3. 导航到 Team Settings → API Keys
  4. 复制你的 摄取 API key
ClickStack API Key

下载 OpenTelemetry Java agent

下载 OpenTelemetry Java agent JAR 文件:

curl -L -O https://github.com/open-telemetry/opentelemetry-java-instrumentation/releases/download/v2.22.0/opentelemetry-javaagent.jar

这会将 agent 下载到你当前的目录。你可以将其放置在适合你部署的位置(例如 /opt/opentelemetry/,或与应用 JAR 放在一起)。

配置 JVM 启动参数

在 JVM 启动命令中添加 Java agent。该 agent 会自动收集 JVM 指标并将其发送到 ClickStack。

选项 1:命令行参数
java -javaagent:opentelemetry-javaagent.jar \
  -Dotel.service.name=my-java-app \
  -Dotel.exporter.otlp.endpoint=http://localhost:4318 \
  -Dotel.exporter.otlp.protocol=http/protobuf \
  -Dotel.exporter.otlp.headers="authorization=YOUR_API_KEY" \
  -Dotel.metrics.exporter=otlp \
  -Dotel.logs.exporter=none \
  -Dotel.traces.exporter=none \
  -jar my-application.jar

将以下内容替换为你自己的值:

  • opentelemetry-javaagent.jar → agent JAR 的完整路径(例如 /opt/opentelemetry/opentelemetry-javaagent.jar
  • my-java-app → 为你的服务指定一个有意义的名称(例如 payment-serviceuser-api
  • YOUR_API_KEY → 上面步骤中获取的 ClickStack API key
  • my-application.jar → 你的应用程序 JAR 文件名
  • http://localhost:4318 → 你的 ClickStack 端点(如果 ClickStack 运行在同一台机器上则使用 localhost:4318,否则使用 http://your-clickstack-host:4318
选项 2:环境变量

或者,使用环境变量:

export JAVA_TOOL_OPTIONS="-javaagent:opentelemetry-javaagent.jar"
export OTEL_SERVICE_NAME="my-java-app"
export OTEL_EXPORTER_OTLP_ENDPOINT="http://localhost:4318"
export OTEL_EXPORTER_OTLP_PROTOCOL="http/protobuf"
export OTEL_EXPORTER_OTLP_HEADERS="authorization=YOUR_API_KEY"
export OTEL_METRICS_EXPORTER="otlp"
export OTEL_LOGS_EXPORTER="none"
export OTEL_TRACES_EXPORTER="none"

java -jar my-application.jar

将以下内容替换为你自己的值:

  • opentelemetry-javaagent.jar → agent JAR 的完整路径
  • my-java-app → 你的服务名称
  • YOUR_API_KEY → 你的 ClickStack API key
  • http://localhost:4318 → 你的 ClickStack 端点
  • my-application.jar → 你的应用程序 JAR 文件名
提示

OpenTelemetry Java agent 会自动收集以下 JVM 指标:

  • 内存jvm.memory.usedjvm.memory.limitjvm.memory.committedjvm.memory.used_after_last_gc
  • 垃圾回收jvm.gc.duration
  • 线程jvm.thread.count
  • jvm.class.countjvm.class.loadedjvm.class.unloaded
  • CPUjvm.cpu.timejvm.cpu.count

在 HyperDX 中验证指标

当你的应用在附加该 agent 的情况下运行时,验证指标是否已经写入 ClickStack:

  1. http://localhost:8080 (或你的 ClickStack URL)打开 HyperDX
  2. 进入 Chart Explorer
  3. 搜索以 jvm. 开头的指标(例如 jvm.memory.usedjvm.gc.durationjvm.thread.count

演示数据集

对于希望在为应用接入监控之前先测试 JVM 指标集成的用户,我们提供了一个示例数据集,其中包含预先生成的指标,模拟了一个中等规模微服务在稳定中等流量下的真实 JVM 行为。

下载示例数据集

# 下载 gauge 指标(内存、线程、CPU、类)
curl -O https://datasets-documentation.s3.eu-west-3.amazonaws.com/clickstack-integrations/jvm/jvm-metrics-gauge.jsonl

# 下载 sum 指标(GC 事件)
curl -O https://datasets-documentation.s3.eu-west-3.amazonaws.com/clickstack-integrations/jvm/jvm-metrics-sum.jsonl

该数据集包含 24 小时的 JVM 指标,展示了:

  • 堆内存增长以及周期性的垃圾回收事件
  • 线程数量变化
  • 真实的 GC 暂停时间
  • 类加载活动
  • CPU 利用率模式

启动 ClickStack

如果您尚未运行 ClickStack:

docker run -d --name clickstack \
  -p 8080:8080 -p 4317:4317 -p 4318:4318 \
  clickhouse/clickstack-all-in-one:latest

等待片刻,直到 ClickStack 完全启动。

导入演示数据集

# 导入 gauge 指标(内存、线程、CPU、类)
docker exec -i clickstack clickhouse-client --query="
  INSERT INTO default.otel_metrics_gauge FORMAT JSONEachRow
" < jvm-metrics-gauge.jsonl

# 导入 sum 指标(GC 事件)
docker exec -i clickstack clickhouse-client --query="
  INSERT INTO default.otel_metrics_sum FORMAT JSONEachRow
" < jvm-metrics-sum.jsonl

这会将指标直接导入到 ClickStack 的指标表中。

验证演示数据

导入完成后:

  1. 在浏览器中打开 http://localhost:8080 访问 HyperDX 并登录(如有需要可先创建账户)
  2. 进入 Search 视图,将 source 设置为 Metrics
  3. 将时间范围设置为 2025-12-06 14:00:00 - 2025-12-09 14:00:00
  4. 搜索 jvm.memory.usedjvm.gc.duration

您应该可以看到该演示服务的指标。

时区显示

HyperDX 会以浏览器本地时区显示时间戳。演示数据涵盖的时间范围为 2025-12-07 14:00:00 - 2025-12-08 14:00:00 (UTC)。请将时间范围设置为 2025-12-06 14:00:00 - 2025-12-09 14:00:00,以确保无论您身在何处都能看到演示指标。确认能看到这些指标后,您可以将范围收窄为 24 小时,以获得更清晰的可视化效果。

仪表板和可视化

为便于使用 ClickStack 监控 JVM 应用,我们提供了一个预先构建的仪表板,其中包含 JVM 指标的关键可视化视图。

下载 仪表板配置

导入预构建的仪表板

  1. 打开 HyperDX 并进入 Dashboards 页面
  2. 点击右上角省略号下的 Import Dashboard
Import dashboard button
  1. 上传 jvm-metrics-dashboard.json 文件并点击 Finish Import
Finish import

查看仪表板

系统会创建仪表板,并预先配置好所有可视化视图:

Kafka Metrics dashboard
注意

对于演示数据集,将时间范围设置为 2025-12-07 14:00:00 - 2025-12-08 14:00:00 (UTC)。可根据本地时区进行调整。

故障排除

Agent 未启动

确认 agent JAR 文件是否存在:

ls -lh /path/to/opentelemetry-javaagent.jar

检查 Java 版本兼容性(需要 Java 8 及以上版本):

java -version

查看 agent 启动时的日志消息: 当你的应用启动时,你应该会看到:

[otel.javaagent] OpenTelemetry Javaagent v2.22.0 started

在 HyperDX 中未显示任何指标

确认 ClickStack 正在运行且可访问:

docker ps | grep clickstack
curl -v http://localhost:4318/v1/metrics

检查是否已配置指标导出器:

# If using environment variables, verify:
echo $OTEL_METRICS_EXPORTER
# Should output: otlp

检查应用程序日志中的 OpenTelemetry 错误: 在应用程序日志中查找与 OpenTelemetry 或 OTLP 导出失败相关的错误消息。

验证网络连通性: 如果 ClickStack 部署在远程主机上,请确保应用服务器可以访问 4318 端口。

确认 agent 版本: 请确保您使用的是最新的稳定版 agent(当前为 2.22.0),新版本通常包含性能改进。

下一步

现在 JVM 指标已经接入 ClickStack,接下来可以:

迁移到生产环境

本指南演示了如何为本地测试配置 OpenTelemetry Java agent。对于生产环境部署,请在容器镜像中包含该 agent 的 JAR 文件,并通过环境变量进行配置,以便更易于管理。对于包含大量 JVM 实例的大型环境,建议部署集中式 OpenTelemetry Collector,对来自多个应用的指标进行批处理并转发,而不是直接发送到 ClickStack。

有关生产环境部署模式和 Collector 配置示例,请参阅 使用 OpenTelemetry 进行数据摄取