Трассировка ClickHouse с помощью OpenTelemetry
OpenTelemetry — это открытый стандарт для сбора трасс и метрик из распределённых приложений. ClickHouse частично поддерживает OpenTelemetry.
Передача контекста трассировки в ClickHouse
ClickHouse принимает HTTP-заголовки контекста трассировки, как описано в рекомендации W3C. Он также принимает контекст трассировки по нативному протоколу, который используется для обмена данными между серверами ClickHouse или между клиентом и сервером. Для ручного тестирования заголовки контекста трассировки, соответствующие спецификации Trace Context, можно передать в clickhouse-client с помощью флагов --opentelemetry-traceparent и --opentelemetry-tracestate.
Если родительский контекст трассировки не передан или переданный контекст трассировки не соответствует указанному выше стандарту W3C, ClickHouse может начать новую трассировку с вероятностью, задаваемой настройкой opentelemetry_start_trace_probability.
Распространение контекста трассировки
Контекст трассировки распространяется в последующие сервисы в следующих случаях:
-
Запросы к удалённым серверам ClickHouse, например, при использовании движка таблиц Distributed.
-
Табличная функция url. Информация о контексте трассировки передаётся в HTTP-заголовках.
Трассировка самого ClickHouse
ClickHouse создаёт trace spans для каждого запроса и некоторых этапов его выполнения, таких как планирование запроса или распределённые запросы.
Чтобы эта информация была полезной, данные трассировки должны быть экспортированы в систему мониторинга, поддерживающую OpenTelemetry, такую как Jaeger или Prometheus. ClickHouse избегает зависимости от конкретной системы мониторинга и вместо этого предоставляет данные трассировки через системную таблицу. Информация о span'ах трассировки OpenTelemetry, требуемая стандартом, хранится в таблице system.opentelemetry_span_log.
Таблица должна быть включена в конфигурации сервера, см. элемент opentelemetry_span_log в файле конфигурации по умолчанию config.xml. По умолчанию она включена.
Теги или атрибуты сохраняются в виде двух параллельных массивов, содержащих ключи и значения. Для работы с ними используйте ARRAY JOIN.
Log-query-settings
Настройка log_query_settings позволяет логировать изменения параметров запроса во время его выполнения. При включении любые изменения настроек запроса будут записываться в журнал спанов OpenTelemetry. Эта функция особенно полезна в продуктивной среде для отслеживания изменений конфигурации, которые могут повлиять на производительность запросов.
Интеграция с системами мониторинга
На данный момент нет готового инструмента, позволяющего экспортировать данные трассировки из ClickHouse в систему мониторинга.
Для тестирования можно настроить экспорт с помощью материализованного представления с движком URL поверх таблицы system.opentelemetry_span_log, которое будет отправлять поступающие лог-записи на HTTP-эндпоинт коллектора трассировок. Например, чтобы отправлять минимальные данные о спане в экземпляр Zipkin, запущенный по адресу http://localhost:9411, в формате Zipkin v2 JSON:
В случае возникновения ошибок та часть данных журнала, для которой произошла ошибка, будет незаметно потеряна. Если данные не поступают, проверьте журнал сервера на наличие сообщений об ошибках.