Профилирование выделения памяти для версий до 25.9

ClickHouse использует jemalloc в качестве глобального драйвера памяти. Jemalloc предоставляет инструменты для выборки и профилирования выделения памяти.

Чтобы сделать профилирование выделения памяти более удобным, предоставляются команды SYSTEM , а также команды четырехбуквенных слов (4LW) в Keeper.

Если вы хотите осуществить выборку и профилирование выделений в jemalloc , вам нужно запустить ClickHouse/Keeper с включенным профилированием, используя переменную окружения MALLOC_CONF :

MALLOC_CONF=background_thread:true,prof:true

jemalloc будет выборочно фиксировать выделения и хранить информацию внутри себя.

Вы можете указать jemalloc сбросить текущий профиль, выполнив:

ClickHouse

Keeper SYSTEM JEMALLOC FLUSH PROFILE echo jmfp | nc localhost 9181

По умолчанию файл профиля кучи будет сгенерирован в /tmp/jemalloc_clickhouse._pid_._seqnum_.heap , где _pid_ — это PID ClickHouse, а _seqnum_ — глобальный номер последовательности для текущего профиля кучи.

Для Keeper файл по умолчанию — /tmp/jemalloc_keeper._pid_._seqnum_.heap и следует тем же правилам.

Можно определить другое местоположение, добавив к переменной окружения MALLOC_CONF опцию prof_prefix .

Например, если вы хотите генерировать профили в папке /data , где префикс имени файла будет my_current_profile , вы можете запустить ClickHouse/Keeper с следующей переменной окружения:

MALLOC_CONF=background_thread:true,prof:true,prof_prefix:/data/my_current_profile

Сгенерированный файл будет дополнен префиксом PID и номером последовательности.

После того как профили кучи были сгенерированы, их нужно проанализировать.

Для этого можно использовать инструмент jemalloc , называемый jeprof. Его можно установить несколькими способами:

Используя менеджер пакетов вашей системы

Клонируя репозиторий jemalloc и запустив autogen.sh из корневой папки. Это предоставит вам скрипт jeprof в папке bin

примечание jeprof использует addr2line для генерации стек-трассировок, что может быть довольно медленно.

В таком случае рекомендуется установить альтернативную реализацию инструмента. git clone https://github.com/gimli-rs/addr2line.git --depth=1 --branch=0.23.0 cd addr2line cargo build --features bin --release cp ./target/release/addr2line path/to/current/addr2line

Существует множество различных форматов, которые можно сгенерировать из профиля кучи с помощью jeprof . Рекомендуется запустить jeprof --help для получения информации об использовании и различных опциях, предоставляемых инструментом.

В общем, команда jeprof используется следующим образом:

jeprof path/to/binary path/to/heap/profile --output_format [ > output_file]

Если вы хотите сравнить, какие выделения произошли между двумя профилями, вы можете установить аргумент base :

jeprof path/to/binary --base path/to/first/heap/profile path/to/second/heap/profile --output_format [ > output_file]

если вы хотите сгенерировать текстовый файл с каждой процедурой, записанной на отдельной строке:

jeprof path/to/binary path/to/heap/profile --text > result.txt

если вы хотите сгенерировать PDF файл с графом вызовов:

jeprof path/to/binary path/to/heap/profile --pdf > result.pdf

jeprof позволяет вам генерировать сжатые стеки для построения графиков пламен.

Вам нужно использовать аргумент --collapsed :

jeprof path/to/binary path/to/heap/profile --collapsed > result.collapsed

После этого вы можете использовать множество различных инструментов для визуализации сжатых стеков.

Самым популярным является FlameGraph, который содержит скрипт под названием flamegraph.pl :

cat result.collapsed | /path/to/FlameGraph/flamegraph.pl --color=mem --title="Allocation Flame Graph" --width 2400 > result.svg

Другим интересным инструментом является speedscope, который позволяет вам более интерактивно анализировать собранные стеки.

Если ClickHouse/Keeper запущен с включенным профилировщиком, поддерживаются дополнительные команды для отключения/включения профилирования выделения во время выполнения. Используя эти команды, легче профилировать только определенные интервалы.

Чтобы отключить профилировщик:

ClickHouse

Keeper SYSTEM JEMALLOC DISABLE PROFILE echo jmdp | nc localhost 9181

Чтобы включить профилировщик:

ClickHouse

Keeper SYSTEM JEMALLOC ENABLE PROFILE echo jmep | nc localhost 9181

Также возможно контролировать начальное состояние профилировщика, установив опцию prof_active , которая включена по умолчанию.

Например, если вы не хотите осуществлять выборку выделений во время старта, а только после, вы можете включить профилировщик. Вы можете запустить ClickHouse/Keeper с следующей переменной окружения:

MALLOC_CONF=background_thread:true,prof:true,prof_active:false

Профилировщик можно включить позже.

jemalloc имеет множество различных опций, связанных с профилировщиком. Они могут контролироваться путем изменения переменной окружения MALLOC_CONF . Например, интервал между выборками выделений можно контролировать с помощью lg_prof_sample .

Если вы хотите сбросить профиль кучи каждые N байт, вы можете включить это, используя lg_prof_interval .

Рекомендуется ознакомиться с страницей ссылок jemalloc для полного списка опций.

ClickHouse/Keeper представляют метрики, связанные с jemalloc , различными способами.

Warning Важно помнить, что ни одна из этих метрик не синхронизирована между собой, и значения могут колебаться.

SELECT * FROM system.asynchronous_metrics WHERE metric LIKE '%jemalloc%' FORMAT Vertical

Содержит информацию о выделении памяти, выполненном через аллокатор jemalloc в различных классах размеров (bins), агрегированных из всех арен.

Все метрики, связанные с jemalloc , из asynchronous_metrics также доступны через конечную точку Prometheus как в ClickHouse, так и в Keeper.

Keeper поддерживает команду jmst 4LW, которая возвращает основные статистические данные аллокатора: