メインコンテンツへスキップ
メインコンテンツへスキップ

system.asynchronous_metrics

ClickHouse Cloud でのクエリ実行

このシステムテーブルのデータは、ClickHouse Cloud の各ノードにローカルに格納されています。そのため、すべてのデータを包括的に確認するには、clusterAllReplicas 関数を使用する必要があります。詳細についてはこちらを参照してください。

説明

バックグラウンドで定期的に計算されるメトリクスを含みます。例えば、RAM の使用量などです。

カラム

  • metric (String) — メトリクス名。
  • value (Float64) — メトリクス値。
  • description (String) — メトリクスの説明。

SELECT * FROM system.asynchronous_metrics LIMIT 10
┌─metric──────────────────────────────────┬──────value─┬─description────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ AsynchronousMetricsCalculationTimeSpent │ 0.00179053 │ Time in seconds spent for calculation of asynchronous metrics (this is the overhead of asynchronous metrics).                                                                                                                                              │
│ NumberOfDetachedByUserParts             │          0 │ The total number of parts detached from MergeTree tables by users with the `ALTER TABLE DETACH` query (as opposed to unexpected, broken or ignored parts). The server does not care about detached parts and they can be removed.                          │
│ NumberOfDetachedParts                   │          0 │ The total number of parts detached from MergeTree tables. A part can be detached by a user with the `ALTER TABLE DETACH` query or by the server itself it the part is broken, unexpected or unneeded. The server does not care about detached parts and they can be removed. │
│ TotalRowsOfMergeTreeTables              │    2781309 │ Total amount of rows (records) stored in all tables of MergeTree family.                                                                                                                                                                                   │
│ TotalBytesOfMergeTreeTables             │    7741926 │ Total amount of bytes (compressed, including data and indices) stored in all tables of MergeTree family.                                                                                                                                                   │
│ NumberOfTables                          │         93 │ Total number of tables summed across the databases on the server, excluding the databases that cannot contain MergeTree tables. The excluded database engines are those who generate the set of tables on the fly, like `Lazy`, `MySQL`, `PostgreSQL`, `SQlite`. │
│ NumberOfDatabases                       │          6 │ Total number of databases on the server.                                                                                                                                                                                                                   │
│ MaxPartCountForPartition                │          6 │ Maximum number of parts per partition across all partitions of all tables of MergeTree family. Values larger than 300 indicates misconfiguration, overload, or massive data loading.                                                                       │
│ ReplicasSumMergesInQueue                │          0 │ Sum of merge operations in the queue (still to be applied) across Replicated tables.                                                                                                                                                                       │
│ ReplicasSumInsertsInQueue               │          0 │ Sum of INSERT operations in the queue (still to be replicated) across Replicated tables.                                                                                                                                                                   │
└─────────────────────────────────────────┴────────────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

メトリックの説明

以下の説明は、utils/generate-async-metrics-docs によって C++ ソースから生成されています。唯一の信頼できる情報源は、src/Common/AsynchronousMetrics.cppsrc/Interpreters/ServerAsynchronousMetrics.cpp、および src/Coordination/KeeperAsynchronousMetrics.cpp にある、各メトリック登録の横に記載された文字列リテラルです。可変の接尾辞 (ディスクごと、CPU ごと、インターフェイスごと、...) を含むメトリック名は、*name* プレースホルダーを使って示されます。実行中のサーバーでは、これらは具体的な接尾辞に置き換えられて報告されます。

AsynchronousHeavyMetricsCalculationTimeSpent

テーブル関連の重い非同期メトリクスの計算に費やされた時間(秒)。これは非同期メトリクスによるオーバーヘッドです。

AsynchronousHeavyMetricsUpdateInterval

重い(テーブル関連)メトリクスの更新間隔

AsynchronousMetricsCalculationTimeSpent

非同期メトリクスの計算に要した時間(秒)。非同期メトリクスに伴うオーバーヘッドを表します。

AsynchronousMetricsUpdateInterval

メトリクス更新間隔

AsyncLoggingmetric_firstQueueSize

このチャネルでログ出力待ちとしてキューに入っている非同期メッセージ数

BlockActiveTime_name

ブロックデバイスに対する IO リクエストがキューに滞留していた時間(秒単位)。これはシステム全体に関するメトリクスであり、clickhouse-server に限らずホストマシン上のすべてのプロセスが対象です。参照元: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockActiveTimePerOp_name

BlockActiveTime メトリクスと同様ですが、この値は IO 操作あたりの時間を算出するために、IO 操作回数で割られています。

BlockDiscardBytes_name

ブロックデバイス上で破棄されたバイト数です。これらの操作は SSD に対して有効です。Discard 操作は ClickHouse では使用されませんが、システム上の他のプロセスで使用される場合があります。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが対象となります。出典: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockDiscardMerges_name

ブロックデバイスに対して要求された discard 操作のうち、OS の I/O スケジューラによってマージされた操作の数です。これらの操作は SSD に関連するものです。discard 操作は ClickHouse 自体では使用しませんが、システム上の他のプロセスで使用される場合があります。これはシステム全体にわたるメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象となります。出典: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockDiscardOps_name

ブロックデバイスに対して要求された discard 操作の数。これらの操作は SSD に関連があります。Discard 操作は ClickHouse 自体では使用されませんが、システム上の他のプロセスで使用される可能性があります。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが含まれます。出典: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockDiscardTime_name

ブロックデバイスに対して要求された Discard 操作に費やされた時間(秒)で、すべての操作の合計です。これらの操作は SSD に関係します。Discard 操作は ClickHouse では使用しませんが、システム上の他のプロセスで使用されることがあります。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象になります。ソース: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt も参照してください。

BlockInFlightOps_name

この値は、デバイスドライバに発行されたものの、まだ完了していない I/O リクエストの数を表します。デバイスドライバにまだ発行されておらず、キュー内にある I/O リクエストは含まれません。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが対象となります。ソース: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt も参照してください。

BlockQueueTime_name

この値は、このブロックデバイスに対する I/O リクエストが待機していたミリ秒数の合計をカウントします。複数の I/O リクエストが待機している場合、この値は「ミリ秒数 × 待機リクエスト数」の積として増加します。これはシステム全体にわたるメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象となります。出典: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockQueueTimePerOp_name

BlockQueueTime メトリクスと同様ですが、値は IO 操作1回あたりの時間になるように、IO 操作回数で割られています。

BlockReadBytes_name

ブロックデバイスから読み取られたバイト数。OS のページキャッシュを使用して I/O を削減するため、ファイルシステムから読み取られたバイト数より少ない場合があります。これはシステム全体にわたるメトリックであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが含まれます。出典: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockReadMerges_name

ブロックデバイスに対して要求され、OS の I/O スケジューラによってマージされた読み取り処理の回数です。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが対象になります。出典: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockReadOps_name

ブロックデバイスに対して要求された読み取り操作の回数。このメトリクスはシステム全体のものであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが対象です。ソース: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockReadTime_name

ブロックデバイスに対して要求されたすべての読み取り操作に費やされた時間の合計(秒)です。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象となります。出典: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockWriteBytes_name

ブロックデバイスに書き込まれたバイト数。OS のページキャッシュの利用により I/O が節約されるため、ファイルシステムに書き込まれたバイト数より少なくなる場合があります。ブロックデバイスへの書き込みは、ライトスルー型のキャッシュのために、対応するファイルシステムへの書き込みよりも後で発生することがあります。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが含まれます。出典: /sys/blockhttps://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockWriteMerges_name

ブロックデバイスへの書き込み要求が、OS の I/O スケジューラによってマージされた回数。このメトリクスはシステム全体の値であり、clickhouse-server だけでなくホストマシン上のすべてのプロセスを含みます。ソース: /sys/block。参照: https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteOps_name

ブロックデバイスに対して要求された書き込み操作の回数。このメトリクスはシステム全体のものであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが含まれます。出典: /sys/block。詳細は https://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

BlockWriteTime_name

ブロックデバイスに対して発行された書き込み処理に費やされた合計時間(秒)です。すべての処理を合算した値であり、システム全体のメトリクスです。ホストマシン上のすべてのプロセスが対象であり、clickhouse-server だけには限定されません。出典: /sys/block。詳細は https://www.kernel.org/doc/Documentation/block/stat.txt を参照してください。

CGroupMaxCPU

CGroups による CPU コア数の上限です。

CGroupMemoryTotal

cgroup 内のメモリの総量をバイト単位で示します。0 の場合、上限は OSMemoryTotal と同じです。

CGroupMemoryUsed

cgroup で使用されているメモリ量を、バイト単位で表したものです。cgroup v2 では anon + sock + 再利用不可のカーネルメモリ、cgroup v1 では RSS を指します。いずれの場合も、カーネル OS のページキャッシュ (ファイルをバックとするキャッシュ) は除外されます。

CGroupMemoryUsedWithoutPageCache

cgroup で使用されているメモリ量 (バイト単位) です。ClickHouse のユーザー空間ページキャッシュは含みません。これは、CGroupMemoryUsed からユーザー空間ページキャッシュのサイズを差し引いた値です。ユーザー空間ページキャッシュが無効な場合、この値は CGroupMemoryUsed と等しくなります。

CGroupSystemTime

CPU コアが OS カーネル (システム) コードを実行していた時間の比率です。

CGroupSystemTimeNormalized

この値は CGroupSystemTime と似ていますが、利用可能な CPU コア数で割ることで、コア数にかかわらず [0..1] の範囲で測定されます。これにより、クラスター内の複数のサーバーでコア数が均一でない場合でも、このメトリックの値を平均し、平均的なリソース使用率を表すメトリックを得ることができます。指定した場合は、実際の CPU コア数の代わりに、Cgroup の CPU QUOTA をその期間で割った値を使用できます。その場合、このメトリックの値が一時的に 1 を超えることがあります。

CGroupUserTime

CPU コアがユーザー空間のコードを実行していた時間の比率です。これには、CPU 内部要因 (メモリロード、パイプラインストール、分岐予測ミス、別の SMT コアの実行) により CPU 資源が十分に活用されていなかった時間も含まれます。

CGroupUserTimeNormalized

この値は CGroupUserTime に似ていますが、利用可能な CPU コア数で割ることで、コア数に関係なく [0..1] の範囲で測定できるようにしたものです。これにより、クラスター内の複数サーバーでコア数が揃っていない場合でも、このメトリクスの値を平均して、平均的なリソース使用率を表すメトリクスを得ることができます。指定されている場合は、実際の CPU コア数の代わりに、Cgroup の CPU QUOTA をその period で割った値を使用できます。その場合、このメトリクスの値は一時的に 1 を超えることがあります。

CPUFrequencyMHz_core_id

CPU の現在の周波数 (MHz 単位) 。ほとんどの最新の CPU では、省電力やターボブーストのために周波数が動的に調整されます。

DictionaryMaxUpdateDelay

Dictionary の更新の最大遅延 (秒)

DictionaryTotalFailedUpdates

すべての Dictionary において、最後に正常にロードされて以降に発生したエラーの数。

DiskAvailable_name

ディスク (仮想ファイルシステム) 上で利用可能なバイト数。リモートファイルシステムでは、この情報が提供されないことがあり、16 EiB のような非常に大きな値が表示される場合があります。

DiskGetObjectThrottlerAvailable_name

ディスク (仮想ファイルシステム) でスロットリングの制限に達することなく、現在実行できる GetObject リクエスト数。ローカルファイルシステムでは、この情報を取得できない場合があります。

DiskGetObjectThrottlerRPS_name

ディスク上の GetObject リクエストスロットリングの上限 (仮想ファイルシステムにおける 1 秒あたりのリクエスト数) 。ローカルファイルシステムでは、この情報が提供されない場合があります。

DiskPutObjectThrottlerAvailable_name

ディスク (仮想ファイルシステム) でスロットリング制限に達せずに現在実行できる PutObject リクエスト数。ローカルファイルシステムでは、この情報を取得できない場合があります。

DiskPutObjectThrottlerRPS_name

ディスク上の PutObject リクエストのスロットリング上限です。単位は 1 秒あたりのリクエスト数です (仮想ファイルシステム) 。ローカルファイルシステムでは、この情報を取得できない場合があります。

DiskTotal_name

ディスク (仮想ファイルシステム) の合計サイズ (バイト単位) です。リモートファイルシステムでは、この情報が提供されない場合があり、16 EiB のような非常に大きな値が表示される場合があります。

DiskUnreserved_name

マージ、フェッチ、および移動用に予約されている領域を除いた、ディスク (仮想ファイルシステム) 上の利用可能なバイト数。リモートファイルシステムでは、この情報が提供されない場合があり、16 EiB のような非常に大きな値が表示されることがあります。

DiskUsed_name

ディスク (仮想ファイルシステム) 上で使用されているバイト数。リモートファイルシステムでは、この情報が常に提供されるとは限りません。

EDACi_Correctable

修正可能なECCメモリエラーの件数です。この値が多い場合はRAMの不良を示しており、直ちに交換する必要があります。修正済みエラーが多数発生している場合、サイレントエラーも発生するおそれがあり、データ破損につながるためです。ソース: /sys/devices/system/edac/mc/

EDACi_Uncorrectable

修正不能なECCメモリエラーの件数です。この値がゼロ以外の場合は、RAMに不良があることを示しており、データ破損の可能性があるため、直ちに交換する必要があります。参照元: /sys/devices/system/edac/mc/

FilesystemCacheBytes

cache 仮想ファイルシステム内の合計バイト数。このキャッシュはディスク上に保存されます。

FilesystemCacheCapacity

cache 仮想ファイルシステムの総容量です。このキャッシュはディスク上に保存されます。

FilesystemCacheFiles

cache 仮想ファイルシステム内にキャッシュされているファイルセグメントの総数です。このキャッシュはディスク上に保持されます。

FilesystemLogsPathAvailableBytes

ClickHouse のログパスがマウントされているボリューム上で使用可能なバイト数です。この値がゼロに近づいている場合は、設定ファイルでログローテーションを調整する必要があります。

FilesystemLogsPathAvailableINodes

ClickHouse のログパスがマウントされているボリューム上で利用可能な inode 数。

FilesystemLogsPathTotalBytes

ClickHouse のログのパスがマウントされているボリュームのサイズ(バイト単位)です。ログ用には少なくとも 10 GB を確保することを推奨します。

FilesystemLogsPathTotalINodes

ClickHouse のログパスがマウントされているボリューム上の inode の総数です。

FilesystemLogsPathUsedBytes

ClickHouse のログパスがマウントされているボリュームで使用中のバイト数。

FilesystemLogsPathUsedINodes

ClickHouse のログのパスがマウントされているボリュームで使用中の inode 数。

FilesystemMainPathAvailableBytes

ClickHouse のメインパスがマウントされているボリュームで利用可能なバイト数。

FilesystemMainPathAvailableINodes

メインの ClickHouse パスがマウントされているボリューム上で利用可能な inode の数です。値がゼロに近い場合は設定の誤りを示しており、ディスクが満杯でなくても「no space left on device」というエラーが発生します。

FilesystemMainPathTotalBytes

ClickHouse のメインパスがマウントされているボリュームの容量(バイト単位)。

FilesystemMainPathTotalINodes

メインの ClickHouse パスがマウントされているボリューム上の inode の総数です。2,500 万未満の場合は、設定ミスであることを示します。

FilesystemMainPathUsedBytes

ClickHouse のメインパスがマウントされているボリューム上で使用されているバイト数です。

FilesystemMainPathUsedINodes

メインの ClickHouse パスがマウントされているボリューム上で使用されている inode の数。この値は主にファイル数に対応します。

GRPCRejectedConnections

GRPCプロトコルで拒否された接続数。

GRPCThreads

gRPC プロトコルサーバーにおけるスレッド数。

HashTableStatsCacheEntries

ハッシュテーブルサイズのキャッシュ内のエントリ数です。ハッシュテーブルサイズのキャッシュは、GROUP BY の予測的な最適化に使用されます。

HashTableStatsCacheHits

ハッシュテーブルのサイズ予測が正しかった回数。

HashTableStatsCacheMisses

ハッシュテーブルのサイズ予測が外れた回数。

HTTPConnectionPoolgroup_nameTCPRcvBufTotalBytes

すべての HTTP 接続プールソケットにおける、カーネル TCP 受信バッファメモリ (sk_rmem_alloc) の合計。

HTTPConnectionPoolgroup_nameTCPSndBufTotalBytes

すべての HTTP 接続プールソケットにおける、カーネル TCP 送信バッファメモリ (sk_wmem_alloc) の合計。

HTTPRejectedConnections

HTTP インターフェイス (TLS なし) で拒否された接続の数。

HTTPSecureRejectedConnections

HTTPSインターフェイスの拒否された接続数。

HTTPSecureThreads

HTTPS インターフェイスサーバーのスレッド数。

HTTPThreads

HTTP インターフェイスサーバーのスレッド数(TLS なし)。

InterserverRejectedConnections

レプリカ間通信プロトコル (TLS なし) で拒否された接続数。

InterserverSecureRejectedConnections

レプリカ間通信プロトコル (TLS 使用) で拒否された接続数。

InterserverSecureThreads

レプリカ間通信プロトコル(TLS 使用)のサーバーで使用されるスレッド数。

InterserverThreads

レプリカ間通信プロトコル用サーバーにおけるスレッド数(TLS を使用しない)。

jemalloc.active

低レベルメモリアロケータ(jemalloc)の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.allocated

低レベルのメモリアロケータ(jemalloc)の内部メトリック。https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.arenas.all.dirty_purged

低レベルメモリアロケータ(jemalloc)の内部メトリクスの 1 つです。https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.arenas.all.muzzy_purged

低レベルメモリアロケータ(jemalloc)の内部メトリックです。詳しくは https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.arenas.all.pactive

低レベルメモリアロケータ(jemalloc)の内部メトリックです。https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.arenas.all.pdirty

低レベルなメモリアロケータ(jemalloc)の内部メトリクスです。https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.arenas.all.pmuzzy

低レベルメモリアロケータ(jemalloc)の内部メトリックです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.arenas.dirty_decay_ms

低レベルメモリアロケータ (jemalloc) の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.background_thread.num_runs

低レベルメモリアロケータ(jemalloc)に関する内部メトリクスです。https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.background_thread.num_threads

低レベルメモリアロケータ(jemalloc)の内部メトリクスです。https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.background_thread.run_intervals

低レベルメモリアロケーター(jemalloc)の内部メトリックです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.cache_arena.pactive

低レベルメモリアロケータ (jemalloc) の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.cache_arena.pdirty

低レベルメモリアロケータ (jemalloc) の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.epoch

すべての jemalloc メトリクスで使用される、jemalloc(Jason Evans のメモリアロケータ)の統計情報に対する内部インクリメンタル更新番号です。

jemalloc.mapped

低レベルなメモリアロケータ(jemalloc)の内部メトリクスです。https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.mergetree_arena.active_bytes

専用の jemalloc MergeTree arena におけるアクティブバイト数です。長期間存続する MergeTree のヒープ状態を保持します。これには、パーツごとのメタデータ (NamesAndTypesListSerializationInfoByNameserializations map、column_name_to_positionMergeTreeDataPartChecksums ツリー、各 IMergeTreeDataPart 内の Poco::LRUCache<String, ColumnSize> デリゲート、パーツごとの ColumnSize/IndexSize map、MinMaxIndexVersionMetadataOnDisk、および MergeTreeDataPart{Compact,Wide} オブジェクト自体) に加え、テーブルごとのメタデータ (setProperties によって設定される StorageInMemoryMetadata / ColumnsDescription / VirtualColumnsDescription のクローン、serialization_hints 集約、および columns_descriptions_cache) も含まれます。アクティブなパーツと、クリーンアップ待ちの古いパーツの両方がこの値に寄与します。これは cache arena および JIT arena とは別物です。パーツごとのカラム system.parts.primary_key_bytes_in_memory[_allocated]system.parts.index_granularity_bytes_in_memory[_allocated] は、このメトリックのサブセットです (それらの値が 0 以外の場合。これらは代わりに PrimaryIndexCacheBytes に存在することもあり、その場合は cache arena に含まれるため、ここではカウントされません) 。

jemalloc.mergetree_arena.dirty_bytes

OS へパージ可能な MergeTree arena 内のダーティバイト数。

jemalloc.mergetree_arena.pactive

低レベルメモリアロケータ (jemalloc) の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.mergetree_arena.pdirty

低レベルメモリアロケータ (jemalloc) の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.metadata

低レベルメモリアロケータ(jemalloc)の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.metadata_thp

低レベルメモリアロケータ(jemalloc)の内部メトリックです。詳細については https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.prof.active

低レベルメモリアロケータ (jemalloc) の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.prof.lg_sample

低レベルメモリアロケータ (jemalloc) の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.prof.thread_active_init

低レベルメモリアロケータ (jemalloc) の内部メトリクスです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.resident

低レベルメモリアロケーター(jemalloc)の内部指標です。https://jemalloc.net/jemalloc.3.html を参照してください。

jemalloc.retained

低レベルのメモリアロケータ(jemalloc)の内部メトリックです。詳細は https://jemalloc.net/jemalloc.3.html を参照してください。

ジッター

非同期メトリクスを計算するスレッドがウェイクアップするようにスケジュールされた時刻と、実際にウェイクアップした時刻との差。システム全体のレイテンシーおよび応答性を示すプロキシ指標です。

KeeperApproximateDataSize

ClickHouse Keeper のおおよそのデータサイズ (バイト単位) 。

KeeperAvgLatency

ClickHouse Keeper の平均リクエストレイテンシ。

KeeperCommitLogsCacheEntries

次にコミットされるログ用にインメモリキャッシュに格納されているエントリ数

KeeperCommitLogsCacheSize

これからコミットされるログ用のインメモリキャッシュの総サイズ

KeeperEphemeralsCount

ClickHouse Keeper内のエフェメラルノードの数。

KeeperFollowers

ClickHouse Keeper のフォロワー数です。

KeeperIsExceedingMemorySoftLimitHit

ClickHouse Keeper がメモリの soft limit を超過している場合は 1、そうでない場合は 0。

KeeperIsFollower

ClickHouse Keeper がフォロワーである場合は 1、そうでない場合は 0。

KeeperIsLeader

ClickHouse Keeper が leader であれば 1、そうでなければ 0 です。

KeeperIsObserver

ClickHouse Keeper がオブザーバーであれば 1、それ以外は 0。

KeeperIsStandalone

ClickHouse Keeper がスタンドアロンモードの場合は 1、それ以外の場合は 0 です。

KeeperKeyArenaSize

ClickHouse Keeper におけるキー用のメモリアリーナのサイズ (バイト単位) です。

KeeperLastCommittedLogIdx

ClickHouse Keeper における、最後にコミットされたログのインデックス番号。

KeeperLastLogIdx

ClickHouse Keeper に保存されている最新のログのインデックス。

KeeperLastLogTerm

ClickHouse Keeper に保存されている最後のログの Raft 任期。

KeeperLastSnapshotIdx

直近に作成されたスナップショットに含まれる最後のログのインデックス。

KeeperLatestLogsCacheEntries

最新のログ向けにインメモリキャッシュに保存されているエントリ数

KeeperLatestLogsCacheSize

最新ログのインメモリキャッシュの合計サイズ

KeeperLatestSnapshotSize

ClickHouse Keeper によって作成された最新のスナップショットの非圧縮サイズ (バイト単位) 。

KeeperMaxFileDescriptorCount

ClickHouse Keeper で開かれているファイルディスクリプタの最大数。

KeeperMaxLatency

ClickHouse Keeper におけるリクエストレイテンシの最大値。

KeeperMinLatency

ClickHouse Keeper のリクエストの最小レイテンシ。

KeeperOpenFileDescriptorCount

ClickHouse Keeper で開かれているファイルディスクリプタの数。

KeeperPacketsReceived

ClickHouse Keeper が受信したパケットの数。

KeeperPacketsSent

ClickHouse Keeper が送信したパケット数。

KeeperPathsWatched

ClickHouse Keeper のクライアントによって watch 対象となっている異なるパスの数。

KeeperSessionWithWatches

ウォッチが設定されている ClickHouse Keeper のクライアントセッション数。

KeeperSyncedFollowers

同期している ClickHouse Keeper のフォロワー数。

KeeperTargetCommitLogIdx

ClickHouse Keeper でログをコミットできる最大インデックス。

KeeperTCPRejectedConnections

Keeper TCPプロトコル (TLSなし) で拒否された接続数。

KeeperTCPSecureRejectedConnections

Keeper TCPプロトコル (TLS使用) の拒否された接続数。

KeeperTCPSecureThreads

TLS を使用する Keeper TCP プロトコルサーバーのスレッド数。

KeeperTCPThreads

TLS を使用しない Keeper TCP プロトコルサーバーのスレッド数。

KeeperWatchCount

ClickHouse Keeper 内のウォッチの数。

KeeperZnodeCount

ClickHouse Keeper 内のノード (データエントリ) の総数。

KeeperZxid

ClickHouse Keeper における現在のトランザクション ID (zxid) 。

LoadAverage1

システム全体の負荷を、1 分間の指数平滑による平均値として表したものです。ここでいう負荷とは、すべてのプロセス (OS カーネルのスケジューリング単位) に属するスレッドの数であり、現在 CPU で実行中か、I/O 待ち、もしくは実行可能だが現時点ではスケジュールされていないものを指します。この数値には、clickhouse-server だけでなく、すべてのプロセスが含まれます。システムが過負荷になり、多数のプロセスが実行可能だが CPU または I/O を待っている場合、この数値は CPU コア数を上回ることがあります。

LoadAverage15

システム全体の負荷を、15 分間の指数平滑による平均値として表したものです。ここでいう負荷とは、すべてのプロセス (OS カーネルのスケジューリング単位) に属するスレッドの数であり、現在 CPU で実行中か、I/O 待ち、もしくは実行可能だが現時点ではスケジュールされていないものを指します。この数値には、clickhouse-server だけでなく、すべてのプロセスが含まれます。システムが過負荷になり、多数のプロセスが実行可能だが CPU または I/O を待っている場合、この数値は CPU コア数を上回ることがあります。

LoadAverage5

システム全体の負荷を、5 分間の指数平滑による平均値として表したものです。ここでいう負荷とは、すべてのプロセス (OS カーネルのスケジューリング単位) に属するスレッドの数であり、現在 CPU で実行中か、I/O 待ち、もしくは実行可能だが現時点ではスケジュールされていないものを指します。この数値には、clickhouse-server だけでなく、すべてのプロセスが含まれます。システムが過負荷になり、多数のプロセスが実行可能だが CPU または I/O を待っている場合、この数値は CPU コア数を上回ることがあります。

LongestRunningMerge

現在実行中のバックグラウンドマージのうち、最も長く実行されているものの経過時間(秒単位)。

MaxPartCountForPartition

MergeTree ファミリーに属するすべてのテーブルにおける、すべてのパーティションを対象とした 1 パーティションあたりの最大パーツ数。300 を超える値は、誤った設定、過負荷、または大量のデータロードを示します。

MemoryCode

サーバープロセスの機械語コードページ用にマップされている仮想メモリ量(バイト単位)。

MemoryDataAndStack

スタックおよび割り当て済みメモリ用にマップされた仮想メモリ量(バイト単位)。スレッドごとのスタックや、mmap システムコールで割り当てられる大部分のメモリを含むかどうかは定義されていません。このメトリクスは、指標の網羅性を保つためだけに存在します。監視には MemoryResident メトリクスを使用することを推奨します。

MemoryResident

サーバープロセスが使用している物理メモリの量(バイト単位)。

MemoryResidentMax

サーバープロセスが使用する物理メモリの最大量(バイト単位)。

MemoryResidentWithoutPageCache

ユーザー空間ページキャッシュを除いた、サーバープロセスが使用する物理メモリ量をバイト単位で表します。ユーザー空間ページキャッシュを利用している場合、実際のメモリ使用量をより正確に把握できます。ユーザー空間ページキャッシュが無効な場合、この値は MemoryResident と同じです。

MemoryShared

サーバープロセスによって使用されているメモリ量のうち、他のプロセスとも共有されている部分をバイト単位で表します。ClickHouse は共有メモリを使用しませんが、一部のメモリが OS の都合により共有としてラベル付けされることがあります。このメトリクスは監視してもあまり意味がなく、完全性を保つためだけに存在しています。

MemoryVirtual

サーバープロセスによって割り当てられた仮想アドレス空間のサイズ(バイト単位)。仮想アドレス空間のサイズは通常、物理メモリ消費量よりもはるかに大きく、実際のメモリ使用量の推定には使用すべきではありません。このメトリクスの値が大きいことはごく正常であり、技術的な意味を持つに過ぎません。

MySQLRejectedConnections

MySQL互換プロトコルで拒否された接続数。

MySQLThreads

MySQL 互換プロトコルサーバーのスレッド数。

NetworkReceiveBytes_interface_name

ネットワークインターフェイス経由で受信したバイト数。これはシステム全体のメトリックであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが対象となります。

NetworkReceiveDrop_interface_name

ネットワークインターフェイス経由で受信中にドロップされたパケットのバイト数。このメトリクスはシステム全体に関するものであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが含まれます。

NetworkReceiveErrors_interface_name

ネットワークインターフェイス経由での受信時に発生したエラーの回数。これはシステム全体にわたるメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが対象です。

NetworkReceivePackets_interface_name

ネットワークインターフェイス経由で受信したネットワークパケットの数です。このメトリクスはシステム全体に対するものであり、ホストマシン上のすべてのプロセス (clickhouse-server だけでなく) を対象とします。

NetworkSendBytes_interface_name

ネットワークインターフェイス経由で送信されたバイト数を表します。これはシステム全体に関するメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象になります。

NetworkSendDrop_interface_name

ネットワークインターフェイス経由で送信中にパケットがドロップされた回数。これはシステム全体にわたるメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象となります。

NetworkSendErrors_interface_name

ネットワークインターフェイス経由で送信中にエラー (例: TCP 再送信) が発生した回数。このメトリクスはシステム全体のもので、ホストマシン上のすべてのプロセスが対象であり、clickhouse-server に限定されません。

NetworkSendPackets_interface_name

ネットワークインターフェイス経由で送信されたネットワークパケットの数。このメトリクスはシステム全体にわたるものであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象です。

NetworkTCPReceiveQueue

TCPv4 および TCPv6 において、サーバーで使用されるネットワークソケットの受信キューの合計サイズ。

NetworkTCPSocketRemoteAddresses

サーバー上で使用されているネットワークソケットについて、TCPv4 および TCPv6 全体での一意なリモートアドレスの総数。

NetworkTCPSockets

サーバー上で使用されているネットワークソケットの総数です。TCPv4 と TCPv6 の両方を含み、すべての状態が対象です。

NetworkTCPSockets_説明

サーバー上の TCPv4 および TCPv6 において、特定の状態にあるネットワークソケットの総数。

NetworkTCPTransmitQueue

サーバーで使用されるネットワークソケットの送信キューの合計サイズです。対象は TCPv4 と TCPv6 です。

NetworkTCPUnrecoveredRetransmits

サーバー上で使用されている TCPv4 および TCPv6 のネットワークソケットにおける、現在の再送信 (現時点では未回復) の総量。

NumberOfDatabases

サーバー上のデータベースの総数。

NumberOfDetachedByUserParts

ALTER TABLE DETACH クエリを使用してユーザーが MergeTree テーブルから切り離したパーツの総数です (予期しないパーツや破損したパーツ、無視されたパーツとは対照的です) 。サーバーは切り離されたパーツを扱わないため、それらは削除してもかまいません。

NumberOfDetachedParts

MergeTree テーブルから切り離されたパーツの総数です。パーツは、ALTER TABLE DETACH クエリを使用してユーザーが切り離すことも、パーツが破損している、想定外である、または不要である場合にサーバーが自動的に切り離すこともあります。サーバーは切り離されたパーツを扱わないため、これらは削除できます。

NumberOfPendingMutations

未処理の mutation の総数です。

NumberOfPendingMutationsOverExecutionTime

指定された max_pending_mutations_execution_time_to_warn 設定を超過し、mutation の適用待ちの data part が残っている mutation の総数。

NumberOfTables

サーバー上のデータベース全体で合計したテーブル数であり、MergeTree テーブルを含むことができないデータベースを除外した値です。除外されるデータベースエンジンには、LazyMySQLPostgreSQLSQlite のように、オンデマンドでテーブルの集合を生成するものが含まれます。

NumberOfTablesSystem

サーバー上の system データベース内で、MergeTree family のテーブルエンジンを使用するテーブルの総数。

OSContextSwitches

ホストマシン上でシステムが行ったコンテキストスイッチの回数です。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象になります。

OSCPUOverload

相対的な CPU 不足を示します。CPU を使用しているスレッド数に対して、CPU 待ちのスレッドがどれだけあるかで計算されます。これが 0 より大きい場合、サーバーにはより多くの CPU があると有益です。これが 0 を大幅に上回る場合、サーバーが応答しなくなる可能性があります。この Metric は、非同期メトリクスの更新間で累積されます。

OSGuestNiceTimecpu_suffix

Linux カーネルの管理下で、ゲスト OS の仮想 CPU が高い優先度に設定されて実行されていた時間の比率 (man procfs を参照) 。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスを含む。ClickHouse にとっては特に意味のないメトリクスだが、網羅性のために定義されている。単一の CPU コアに対する値は [0..1] の範囲となる。すべての CPU コアに対する値は、それらを合計した [0..num cores] の範囲で計算される。

OSGuestNiceTimeNormalized

この値は OSGuestNiceTime と同様ですが、CPU コア数で割った値であり、コア数に依存せず [0..1] の範囲で測定できるようにしたものです。これにより、コア数が揃っていないクラスター内の複数サーバー間でも本メトリクスの値を平均化でき、平均的なリソース利用状況を表すメトリクスを取得できます。指定されている場合には、実際の CPU コア数の代わりに Cgroup の CPU QUOTA をその period で割った値を使用できますが、その場合、このメトリクスの値が一時的に 1 を超えることがあります。

OSGuestTimecpu_suffix

Linux カーネルの制御下で、ゲスト OS 向けに仮想 CPU を実行していた時間の比率です (man procfs を参照) 。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが含まれます。このメトリクスは ClickHouse 固有のものではありませんが、網羅性のために定義されています。1 つの CPU コアに対する値は [0..1] の範囲になります。すべての CPU コアに対する値は、各コアの値を合計して [0..num cores] の範囲で計算されます。

OSGuestTimeNormalized

この値は OSGuestTime と同様ですが、CPU コア数で割ることで、コア数に依存せず [0..1] の範囲で測定できるようにしたものです。これにより、コア数が不均一なクラスタ内の複数サーバ間でもこのメトリクスの値を平均化でき、平均的なリソース使用率を表すメトリクスを得ることができます。指定されていれば、実際の CPU コア数の代わりに Cgroup の CPU QUOTA をその期間で割った値を用いることができ、その場合、このメトリクスの値がある時点で 1 を超えることがあります。

OSIdleTimecpu_suffix

OS カーネルの観点から見た、CPU コアがアイドル状態 (I/O 待ちで実行待機しているプロセスすら存在しない状態) であった時間の割合です。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスを含みます。また、CPU 内部の要因 (メモリロード、パイプラインストール、分岐予測ミス、別の SMT コアの実行) によって CPU の利用率が低下していた時間は含みません。単一の CPU コアに対する値は [0..1] の範囲になります。すべての CPU コアに対する値は、それらを合計したものとして [0..CPU コア数] の範囲で計算されます。

OSIdleTimeNormalized

この値は OSIdleTime と同様ですが、CPU コア数で割った値であり、コア数に依存せず 0〜1 の範囲で測定されます。これにより、コア数が不均一なクラスター内の複数サーバー間でも、このメトリクスの値を平均化して、平均的なリソース利用率メトリクスを取得できます。指定されている場合には、実際の CPU コア数の代わりに Cgroup の CPU QUOTA をその period で割った値を使用できます。その場合、このメトリクスの値が一時的に 1 を超えることがあります。

OSInterrupts

ホストマシン上で発生した割り込みの総数です。これはシステム全体に関するメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスによるものが含まれます。

OSIOWaitTimecpu_suffix

CPU コアがコードを実行しておらず、プロセスが I/O を待機しているために OS カーネルもこの CPU 上で他のプロセスを実行していなかった時間の比率です。これはシステム全体で集計されるメトリクスであり、ClickHouse サーバーだけでなくホストマシン上のすべてのプロセスが含まれます。単一の CPU コアに対する値は [0..1] の範囲になります。すべての CPU コアに対する値は、各コアの値を合計したものであり、[0..コア数] の範囲になります。

OSIOWaitTimeNormalized

この値は OSIOWaitTime と同様ですが、CPU コア数で割ることで、コア数に依存せず 0〜1 の範囲で測定できるようにしたものです。これにより、コア数が揃っていないクラスター内の複数サーバー間でもこのメトリクスの値を平均化でき、リソース使用率の平均的なメトリクスを得ることができます。指定されている場合は、実際の CPU コア数の代わりに、Cgroup の CPU クォータをその period で割った値を使用できます。この場合、このメトリクスの値が一時的に 1 を超えることがあります。

OSIrqTimecpu_接尾辞

CPU 上でハードウェア割り込み要求を処理するのに費やされた時間の割合です。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスを含みます。このメトリクスの値が高い場合、ハードウェアの誤設定や非常に高いネットワーク負荷を示している可能性があります。単一の CPU コアに対する値は [0..1] の範囲になります。すべての CPU コアに対する値は、それらの合計として計算され、[0..num cores] の範囲になります。

OSIrqTimeNormalized

この値は OSIrqTime と同様ですが、CPU コア数で割った値であり、コア数に関係なく [0..1] の範囲で計測できるようにしたものです。これにより、コア数が均一でないクラスター内の複数サーバー間でもこのメトリクスの値を平均化でき、平均的なリソース使用率を表す指標を得ることができます。指定されている場合は、実際の CPU コア数の代わりに、Cgroup の CPU QUOTA をその period で割った値を使用できますが、その場合、このメトリクスの値が一時的に 1 を超えることがあります。

OSMemoryAvailable

プログラムが使用可能なメモリ量(バイト単位)。OSMemoryFreePlusCached メトリクスと非常によく似ています。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上で動作するすべてのプロセスが対象となります。

OSMemoryBuffers

OS カーネルバッファで使用されているメモリ量(バイト単位)。通常は小さい値になるはずであり、大きな値は OS の誤設定を示している可能性があります。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスを対象とします。

OSMemoryCached

OS のページキャッシュによって使用されているメモリ量(バイト単位)です。通常、利用可能なメモリのほぼすべてが OS のページキャッシュとして使用されるため、このメトリクスの値が高いことは正常かつ想定どおりの状態です。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスを含みます。

OSMemoryFreePlusCached

ホストシステム上の空きメモリ量と OS ページキャッシュメモリ量の合計(バイト単位)。このメモリはプログラムが利用できるメモリです。値は OSMemoryAvailable と非常に近い値になるはずです。これはシステム全体に対するメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象に含まれます。

OSMemoryFreeWithoutCached

ホストシステム上の空きメモリ量 (バイト単位) 。これは OS のページキャッシュメモリとして使用されているメモリ量を含みません。ページキャッシュメモリはプログラムからも利用可能であるため、このメトリクスの値は分かりにくい場合があります。代わりに OSMemoryAvailable メトリクスを参照してください。利便性のため、OSMemoryFreePlusCached メトリクスも提供しており、これは OSMemoryAvailable とおおよそ同様の値になるはずです。https://www.linuxatemyram.com/ も参照してください。これはシステム全体に関するメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスを含みます。

OSMemorySwapCached

スワップ上にあり、かつ RAM にも読み込まれているメモリ量。スワップは本番システムでは無効化する必要があります。このメトリックの値が大きい場合は、設定ミスを示します。これはシステム全体のメトリックであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが対象となります。

OSMemoryTotal

ホストシステムに搭載されているメモリの総量(バイト単位)。

OSNiceTimecpu_suffix

CPU コアが高い優先度でユーザー空間コードを実行していた時間の比率です。これはシステム全体に対するメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象となります。単一の CPU コアに対する値は [0..1] の範囲になります。すべての CPU コアに対する値は、各コアの値を合計したものであり、範囲は [0..num cores] になります。

OSNiceTimeNormalized

この値は OSNiceTime と同様ですが、CPU コア数で割ることで、コア数に依存せず [0..1] の範囲で測定できるようにした指標です。これにより、サーバーごとにコア数が異なるクラスター環境でも、このメトリクスの値を複数サーバー間で平均化でき、平均的なリソース使用率を表すメトリクスを取得できます。指定されている場合は、実際の CPU コア数の代わりに Cgroup の CPU QUOTA をその period で割った値を使用することができ、その場合、このメトリクスの値が一時的に 1 を超えることがあります。

OSOpenFiles

ホストマシン上で開かれているファイルの総数です。これはシステム全体に関するメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象です。

OSProcessesBlocked

I/O 完了を待ってブロックされているスレッド数(man procfs を参照)。これはシステム全体に関するメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが含まれます。

OSProcessesCreated

作成されたプロセスの数です。これはシステム全体にわたるメトリクスで、ホストマシン上のすべてのプロセスが対象であり、clickhouse-server だけに限定されません。

OSProcessesRunning

オペレーティングシステムによって実行可能(実行中または実行待ち)とされているスレッド数です。これはシステム全体のメトリクスであり、ホストマシン上のすべてのプロセスを含み、clickhouse-server だけに限定されません。

OSSoftIrqTimecpu_suffix

CPU 上でソフトウェア割り込み要求 (softirq) の処理に費やされた時間の割合です。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが対象となります。このメトリクスの値が高い場合は、システム上で非効率なソフトウェアが動作している可能性を示します。単一の CPU コアに対する値は [0..1] の範囲になります。すべての CPU コアに対する値は、それらを合計した [0..コア数] の範囲になります。

OSSoftIrqTimeNormalized

この値は OSSoftIrqTime と同様ですが、CPU コア数で割ることで、コア数に依存せず [0..1] の範囲で表現されるようにしたものです。これにより、クラスタ内でコア数が不均一な複数サーバー間でも、このメトリクスの値を平均して、リソース使用率の平均を表すメトリクスを得ることができます。指定されている場合には、実際の CPU コア数の代わりに、Cgroup の CPU QUOTA をその period で割った値を使用できます。この場合には、このメトリクスの値が一時的に 1 を超えることがあります。

OSStealTimecpu_suffix

仮想化環境で動作している際に、CPU 時間のうち他のオペレーティングシステムに割り当てられている時間の比率です。これはシステム全体のメトリクスであり、clickhouse-server だけでなく、ホストマシン上のすべてのプロセスが対象となります。このメトリクスを提供しない仮想化環境も多く、ほとんどの環境では利用できません。単一の CPU コアに対する値は区間 [0..1] の範囲になります。すべての CPU コアに対する値は、各コアの値を合計したもので [0..num cores] の範囲になります。

OSStealTimeNormalized

この値は OSStealTime と同様ですが、CPU コア数で割ったものであり、コア数に依存せず [0..1] の範囲で測定されます。これにより、クラスター内でコア数が不均一な複数サーバー間でも、このメトリクスの値を平均化し、平均的なリソース使用率の指標を得ることができます。設定されている場合には、実際の CPU コア数の代わりに、Cgroup の CPU QUOTA をその period で割った値を使用でき、その場合、このメトリクスの値が瞬間的に 1 を超えることがあります。

OSSystemTimecpu_suffix

CPU コアが OS カーネル (システム) コードを実行していた時間の比率です。これはホストマシン上のすべてのプロセスを含むシステム全体のメトリクスであり、clickhouse-server だけを対象にしたものではありません。単一の CPU コアに対する値は [0..1] の範囲になります。すべての CPU コアに対する値は、各コアの値を合計したもので [0..コア数] の範囲になります。

OSSystemTimeNormalized

この値は OSSystemTime と同様ですが、CPU コア数で割ることで、コア数に依存せず [0..1] の範囲で測定できるようにしたものです。これにより、コア数が不揃いなクラスタ内の複数サーバー間でもこのメトリクス値を平均化でき、平均的なリソース利用率を表すメトリクスを得ることができます。Cgroup の CPU QUOTA が指定されている場合は、実際の CPU コア数の代わりに、その期間で割った QUOTA の値を使用することができ、その場合、このメトリクスの値が一時的に 1 を超えることがあります。

OSThreadsRunnable

OS カーネルスケジューラから見て「runnable」状態にあるスレッドの総数。

OSThreadsTotal

OS カーネルスケジューラから見て認識されるスレッドの総数。

OSUptime

ホストサーバー(ClickHouse が稼働しているマシン)の稼働時間(秒)。

OSUserTimecpu_suffix

CPU コアがユーザー空間のコードを実行していた時間の比率です。これはシステム全体のメトリクスであり、clickhouse-server だけでなくホストマシン上のすべてのプロセスが含まれます。これには、CPU 内部の要因 (メモリロード、パイプラインスタール、分岐予測ミス、別の SMT コアの実行) によって CPU が十分に活用されていなかった時間も含まれます。単一の CPU コアに対する値は [0..1] の範囲になります。すべての CPU コアに対する値は、それらを合計した [0..CPU コア数] の範囲になります。

OSUserTimeNormalized

この値は OSUserTime と同様ですが、CPU コア数で割ることで、コア数に依存せず [0..1] の範囲に正規化されます。これにより、クラスタ内でコア数が揃っていない複数のサーバー間でも、このメトリクスの値を平均し、平均的なリソース利用率のメトリクスを得ることができます。Cgroup の CPU クォータが指定されている場合は、実際の CPU コア数の代わりに、そのクォータをその期間で割った値を使用することができ、その場合には、このメトリクスの値が一時的に 1 を超えることがあります。

PageCacheMaxBytes

ユーザー空間の page cache の現在のサイズ上限 (バイト単位) 。

PostgreSQLRejectedConnections

PostgreSQL互換プロトコルにおいて拒否された接続数。

PostgreSQLThreads

PostgreSQL 互換プロトコルのサーバーのスレッド数。

ProcessSignalQueueLimit

シグナルキュー全体の上限です (ProcessSignalQueueSize に達すると、CANNOT_CREATE_TIMER エラーが発生することがあります)

ProcessSignalQueueSize

シグナルキューのサイズ (未処理のシグナル、クエリプロファイリング用のタイマー)

PrometheusRejectedConnections

Prometheus エンドポイントで拒否された接続数。注: Prometheus エンドポイントは通常の HTTP/HTTPS ポート経由でも使用できます。

PrometheusThreads

Prometheus エンドポイントのサーバーのスレッド数。なお、Prometheus エンドポイントは通常の HTTP/HTTPS ポート経由でも使用できます。

PSI_type_stall_type

前回の測定以降のストール時間 (マイクロ秒単位) 。このメトリクスと解釈方法については、アップストリームドキュメント https://docs.kernel.org/accounting/psi.html を参照してください

QueriesMemoryUsage

サーバー上で実行中のすべてのクエリが現在使用しているメモリの合計 (バイト単位) 。同時実行されるクエリの負荷によるメモリ逼迫の把握に役立ちます。

QueriesPeakMemoryUsage

ProcessList で追跡されている全ユーザーについて、ユーザーごとのクエリのメモリ使用量ピークを合計した値です。単位はバイトです。各ユーザーのピークは、そのユーザーの memory tracker における最高水位であり、そのユーザーに実行中のクエリがなくなるとリセットされます。したがって、これは現在追跡対象となっているユーザーごとのピークの集計値であり、起動以降のすべてのクエリを対象としたサーバー全体の単一ピーク値ではありません。

ReplicasMaxAbsoluteDelay

すべての Replicated テーブルにおいて、最も新しいレプリケート済みパーツと、まだレプリケートされていない最も新しいデータパーツとの最大時間差(秒)。非常に大きい値は、データが存在しないレプリカであることを示します。

ReplicasMaxInsertsInQueue

Replicated テーブル全体で、キュー内(まだレプリケートされていない)に保持できる INSERT 操作の最大数。

ReplicasMaxMergesInQueue

すべての Replicated テーブルを対象として、キュー内にある(まだ適用されていない)マージ処理の最大数。

ReplicasMaxQueueSize

Replicated テーブル全体での最大キューサイズ(get や merge などの操作数の合計)。

ReplicasMaxRelativeDelay

Replicated テーブル全体で、各レプリカの遅延と、同じテーブルにおける最新のレプリカの遅延との差分の最大値。

ReplicasSumInsertsInQueue

Replicated テーブル全体で、キューにたまっている(まだレプリケートされていない)INSERT 操作の合計値。

ReplicasSumMergesInQueue

Replicated テーブル全体で、キュー内(まだ適用されていない)にあるマージ処理数の合計。

ReplicasSumQueueSize

Replicated テーブル全体にわたるキューサイズの合計(get や merge などの操作数)。

TCPRejectedConnections

TLS を使用しない TCP プロトコルで拒否された接続数。

TCPSecureRejectedConnections

TLS を使用する TCP プロトコルで拒否された接続数。

TCPSecureThreads

TLS を使用する TCP プロトコルサーバーのスレッド数。

TCPThreads

TCP プロトコル(TLS なし)のサーバーのスレッド数。

Temperaturei

対応するデバイスの温度 (℃) です。センサーが現実的でない値を返すことがあります。ソース: /sys/class/thermal

Temperature_hwmon_name

対応するハードウェアモニターによって報告される温度 (℃) 。センサーによっては、現実的ではない値を返す場合があります。ソース: /sys/class/hwmon

Temperature_hwmon_name_sensor_name

対応するハードウェアモニターおよびセンサーによって報告される温度 (℃) 。センサーによっては、現実的ではない値を返す場合があります。ソース: /sys/class/hwmon

TotalBytesOfMergeTreeTables

すべての MergeTree ファミリーのテーブルに保存されている圧縮済みバイト数の合計(データおよびインデックスを含む)。

TotalBytesOfMergeTreeTablesSystem

systemデータベース内のMergeTree familyのテーブルに格納されている総バイト数 (圧縮後、データおよびインデックスを含む) 。

TotalIndexGranularityBytesInMemory

インデックスグラニュールが使用するメモリの総量 (バイト単位、アクティブなパーツのみを考慮) 。

TotalIndexGranularityBytesInMemoryAllocated

インデックスグラニュール用に確保されたメモリの総量 (バイト単位、アクティブなパーツのみを対象) 。

TotalPartsOfMergeTreeTables

MergeTree family に属するすべてのテーブルに含まれるデータパーツの合計数。10 000 を超える数はサーバーの起動時間に悪影響を与え、パーティションキーの選択が不適切である可能性を示します。

TotalPartsOfMergeTreeTablesSystem

system データベース内の MergeTree family に属するテーブルに含まれるデータパーツの合計数。

TotalPrimaryKeyBytesInMemory

プライマリキー値により使用されているメモリ量の合計(バイト単位)。アクティブなパーツのみが対象です。

TotalPrimaryKeyBytesInMemoryAllocated

プライマリキー値のために確保されているメモリ容量の合計(バイト単位)。アクティブなパーツのみが対象です。

TotalProjectionIndexGranularityBytesInMemory

プロジェクション索引の粒度で使用されるメモリの総量 (バイト単位、アクティブなパーツのみを考慮) 。

TotalProjectionIndexGranularityBytesInMemoryAllocated

プロジェクション索引の粒度用に確保されているメモリの総量 (バイト単位。アクティブなパーツのみを対象) 。

TotalProjectionPrimaryKeyBytesInMemory

プロジェクションの主キー値で使用されるメモリの総量 (バイト単位。アクティブなパーツのみを対象) 。

TotalProjectionPrimaryKeyBytesInMemoryAllocated

プロジェクションの主キー値用に確保されているメモリの総量 (バイト単位) 。アクティブなパーツのみを対象とします。

TotalRowsOfMergeTreeTables

MergeTree ファミリーに属するすべてのテーブルに格納されている行(レコード)の合計数。

TotalRowsOfMergeTreeTablesSystem

system データベース内の MergeTree family のテーブルに格納されている行 (レコード) の総行数。

TrackedMemory

ClickHouse が追跡するメモリ量 (MemoryTracking メトリックと等しいはずです) 。単位はバイトです。

稼働時間

秒単位のサーバー稼働時間です。接続を受け付ける前のサーバー初期化に要した時間も含みます。

VMMaxMapCount

プロセスが持てるメモリマッピングの最大数です (/proc/sys/vm/max_map_count) 。

VMNumMaps

プロセスの現在のメモリマッピング数 (/proc/self/maps) です。最大値 (VMMaxMapCount) に近い場合は、/etc/sysctl.conf で vm.max_map_count の上限を引き上げてください

ZooKeeperClientLastZXIDSeen

現在の ZooKeeper クライアントセッションで最後に確認された ZXID です。この値は、クライアントが ZooKeeper からのトランザクションを観測するにつれて単調に増加します。

関連項目

  • Monitoring — ClickHouse のモニタリングに関する基本概念。
  • system.metrics — 即時計算されるメトリクスを含みます。
  • system.events — 発生したイベントの数を含みます。
  • system.metric_logsystem.metrics および system.events テーブルにおけるメトリクス値の履歴を保持します。