内存分配分析
ClickHouse 使用 jemalloc 作为其全局分配器,并带有一些内存分配采样和分析的工具。
为了使内存分配分析更加便利,SYSTEM
命令与 Keeper 中的 4LW 命令一起提供。
采样内存分配和清空堆配置文件
如果我们想要在 jemalloc
中采样和分析内存分配,我们需要使用环境变量 MALLOC_CONF
启动 ClickHouse/Keeper,并启用分析功能。
jemalloc
将采样内存分配并在内部存储信息。
我们可以通过运行以下命令来让 jemalloc
清空当前分析:
- ClickHouse
- Keeper
SYSTEM JEMALLOC FLUSH PROFILE
echo jmfp | nc localhost 9181
默认情况下,堆配置文件会生成在 /tmp/jemalloc_clickhouse._pid_._seqnum_.heap
,其中 _pid_
是 ClickHouse 的 PID,_seqnum_
是当前堆配置文件的全局序列号。
对于 Keeper,默认文件是 /tmp/jemalloc_keeper._pid_._seqnum_.heap
,遵循相同规则。
通过在 MALLOC_CONF
环境变量中添加 prof_prefix
选项,可以定义不同的位置。
例如,如果我们想在 /data
文件夹中生成配置文件,并希望文件名的前缀为 my_current_profile
,可以通过以下环境变量启动 ClickHouse/Keeper:
生成的文件将附加 PID 和序列号到前缀。
分析堆配置文件
在生成堆配置文件后,我们需要分析它们。
为此,我们需要使用 jemalloc
的工具 jeprof,可以通过多种方式安装:
- 使用系统的包管理器安装
jemalloc
- 克隆 jemalloc 仓库,并从根文件夹运行 autogen.sh,这将为您提供
bin
文件夹中的jeprof
脚本
使用 jeprof
从堆配置文件生成的格式有很多种。
我们建议运行 jeprof --help
来检查该工具提供的用法和许多不同的选项。
一般来说,jeprof
命令看起来是这样的:
如果我们想比较两个配置文件之间发生的内存分配,可以设置基准参数:
例如:
- 如果我们想生成一个文本文件,每行写一个过程:
- 如果我们想生成一个包含调用图的 PDF 文件:
生成火焰图
jeprof
允许我们生成用于构建火焰图的折叠堆栈。
我们需要使用 --collapsed
参数:
之后,我们可以使用多种不同的工具来可视化折叠的栈。
最受欢迎的工具是 FlameGraph,它包含一个名为 flamegraph.pl
的脚本:
另一个有趣的工具是 speedscope,它允许您更互动地分析收集到的栈。
在运行时控制分配分析器
如果 ClickHouse/Keeper 是以启用分析器的方式启动的,它们支持在运行时禁用/启用内存分配分析的额外命令。
使用这些命令,可以更容易地仅在特定时间段进行分析。
禁用分析器:
- ClickHouse
- Keeper
SYSTEM JEMALLOC DISABLE PROFILE
echo jmdp | nc localhost 9181
启用分析器:
- ClickHouse
- Keeper
SYSTEM JEMALLOC ENABLE PROFILE
echo jmep | nc localhost 9181
通过设置 prof_active
选项,还可以控制分析器的初始状态,默认情况下是启用的。
例如,如果我们不希望在启动期间采样内存分配,而仅在启用分析器后进行采样,我们可以使用以下环境变量启动 ClickHouse/Keeper:
并在稍后启用分析器。
分析器的其他选项
jemalloc
提供了许多与分析器相关的选项,可以通过修改 MALLOC_CONF
环境变量进行控制。
例如,可以使用 lg_prof_sample
控制内存分配采样之间的间隔。
如果想要在每 N 字节时转储堆配置文件,可以通过 lg_prof_interval
启用它。
我们建议查看 jemalloc
的 参考页面 获取此类选项。
其他资源
ClickHouse/Keeper 通过多种方式暴露与 jemalloc
相关的指标。
重要的是要意识到,这些指标之间没有同步,并且数值可能会漂移。
系统表 asynchronous_metrics
系统表 jemalloc_bins
包含通过 jemalloc 分配器在不同大小类别(bins)中完成的内存分配的信息,这些信息是从所有区域汇总而来的。
Prometheus
所有与 jemalloc
相关的指标来自 asynchronous_metrics
,也可以通过 ClickHouse 和 Keeper 中的 Prometheus 端点进行访问。
Keeper 中的 jmst
4LW 命令
Keeper 支持 jmst
4LW 命令,该命令返回 基本分配器统计信息。
示例: