テーブルパーティション - ClickHouse Documentation

ClickHouse におけるテーブルのパーティションとは？

パーティションは、MergeTree エンジンファミリーのテーブルにあるデータパーツを、整理された論理的な単位としてまとめるための仕組みです。これは、時間範囲、カテゴリ、その他の主要な属性といった特定の基準に基づいて、概念的に意味のある形でデータを整理する方法です。こうした論理単位により、データの管理、クエリ、最適化がしやすくなります。

PARTITION BY

パーティション化は、テーブルの初期定義時に PARTITION BY 句を指定することで有効にできます。この句には任意のカラムに対する SQL 式を含めることができ、その結果によって各行がどのパーティションに属するかが決まります。これを説明するために、What are table parts のサンプルテーブルに PARTITION BY toStartOfMonth(date) 句を追加して拡張します。これにより、テーブルのデータパーツが不動産売買の月ごとに整理されます。

CREATE TABLE uk.uk_price_paid_simple_partitioned
(
    date Date,
    town LowCardinality(String),
    street LowCardinality(String),
    price UInt32
)
ENGINE = MergeTree
ORDER BY (town, street)
PARTITION BY toStartOfMonth(date);

当社のClickHouse SQL Playgroundで、このテーブルにクエリを実行できます。

ディスク上の構造

テーブルに行のセットが挿入されるたびに、挿入されたすべての行を含む単一のデータパーツを (少なくとも) 1 つ作成するのではなく (こちらで説明しているとおり) 、ClickHouse は、挿入された行の中で一意な各パーティションキーの値ごとに、新しいデータパーツを 1 つ作成します。
ClickHouse サーバーはまず、上の図に示されている 4 行の挿入例の行を、パーティションキーの値 toStartOfMonth(date) ごとに分割します。次に、特定された各パーティションについて、通常どおり複数の連続した手順 (① ソート、② カラムへの分割、③ 圧縮、④ ディスクへの書き込み) で行が処理されます。パーティション化を有効にすると、ClickHouse は各データパーツに対して自動的に MinMax indexes を作成する点に注意してください。これらは単に、パーティションキー式で使用される各テーブルカラムごとのファイルであり、そのデータパーツ内におけるそのカラムの最小値と最大値が含まれています。

パーティションごとのマージ

パーティション化を有効にすると、ClickHouse はパーティションをまたいでではなく、各パーティション内でのみデータパーツをマージします。この動作を、上記の例のテーブルで図示します。
上の図のとおり、異なるパーティションに属するパーツがマージされることはありません。カーディナリティの高いパーティションキーを選ぶと、パーツが数千ものパーティションに分散し、マージ候補になることがないため、事前設定された制限を超えて、厄介なToo many partsエラーの原因になります。この問題への対処は簡単です。適切なパーティションキーを選び、カーディナリティを 1000..10000 未満にしてください。

パーティションの監視

仮想カラム _partition_value を使うと、サンプルテーブルに存在する一意なパーティションの一覧をクエリできます。あるいは、ClickHouse はすべてのテーブルのすべてのパーツとパーティションを system.parts システムテーブルで追跡しています。次のクエリは、上記のサンプルテーブルについて、すべてのパーティションの一覧に加え、パーティションごとの現在アクティブなパーツ数と、それらのパーツに含まれる行数の合計を返します。

テーブルのパーティションは何に使われますか？

データ管理

ClickHouse では、パーティション化は主にデータ管理のための機能です。パーティション式に基づいてデータを論理的に整理することで、各パーティションを個別に管理できます。たとえば、上記のサンプルテーブルのパーティション化方式では、有効期限 (TTL) ルールを使って古いデータを自動的に自動削除し、メインテーブルには直近 12 か月分のデータのみを保持するといった運用が可能です (DDL ステートメントに追加された最後の行を参照) 。:

CREATE TABLE uk.uk_price_paid_simple_partitioned
(
    date Date,
    town LowCardinality(String),
    street LowCardinality(String),
    price UInt32
)
ENGINE = MergeTree
PARTITION BY toStartOfMonth(date)
ORDER BY (town, street)
TTL date + INTERVAL 12 MONTH DELETE;

テーブルは toStartOfMonth(date) でパーティション分割されているため、有効期限 (TTL) の条件を満たすパーティション全体 (テーブルパーツの集合) が削除され、パーツを書き換えることなくクリーンアップ処理をより効率的に実行できます。同様に、古いデータを削除する代わりに、よりコスト効率に優れたストレージティアに自動的かつ効率的に移動することもできます:

CREATE TABLE uk.uk_price_paid_simple_partitioned
(
    date Date,
    town LowCardinality(String),
    street LowCardinality(String),
    price UInt32
)
ENGINE = MergeTree
PARTITION BY toStartOfMonth(date)
ORDER BY (town, street)
TTL date + INTERVAL 12 MONTH TO VOLUME 'slow_but_cheap';

クエリ最適化

パーティションはクエリパフォーマンスの向上に役立つ場合がありますが、その効果はアクセスパターンに大きく左右されます。クエリの対象が少数のパーティション (理想的には 1 つ) に限られる場合は、パフォーマンスの向上が見込めます。これは通常、以下のクエリ例のように、パーティションキーが主キーに含まれておらず、そのパーティションキーでフィルタリングしている場合に特に有効です。このクエリは、上記の例のテーブルに対して実行され、テーブルのパーティションキーに使われているカラム (date) と、テーブルの主キーに使われているカラム (town) の両方でフィルタリングすることで、2020 年 12 月にロンドンで売却されたすべての不動産の最高価格を算出します (date は主キーの一部ではありません)。 ClickHouse はこのクエリを処理する際、無関係なデータを評価しないよう、一連のプルーニング手法を適用します。
① パーティションプルーニング: テーブルのパーティションキーに使われているカラムに対するクエリのフィルタに論理的に一致しないパーティション全体 (パーツの集合) を除外するために、MinMax indexes が使用されます。 ② Granule pruning: 手順 ① の後に残った data parts に対しては、プライマリインデックスを使い、テーブルの主キーに使われているカラムに対するクエリのフィルタに論理的に一致しないすべてのグラニュール (行の block) を除外します。これらのデータプルーニングのステップは、上記のクエリ例について、EXPLAIN 句を使って物理的なクエリ実行計画を確認することで観察できます。

EXPLAIN indexes = 1
SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple_partitioned
WHERE date >= '2020-12-01'
  AND date <= '2020-12-31'
  AND town = 'LONDON';

    ┌─explain──────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ Expression ((Project names + Projection))                                                                    │
│   Aggregating                                                                                                │
│     Expression (Before GROUP BY)                                                                             │
│       Expression                                                                                             │
│         ReadFromMergeTree (uk.uk_price_paid_simple_partitioned)                                              │
│         Indexes:                                                                                             │
│           MinMax                                                                                             │
│             Keys:                                                                                            │
│               date                                                                                           │
│             Condition: and((date in (-Inf, 18627]), (date in [18597, +Inf)))                                 │
│             Parts: 1/436                                                                                     │
│             Granules: 11/3257                                                                                │
│           Partition                                                                                          │
│             Keys:                                                                                            │
│               toStartOfMonth(date)                                                                           │
│             Condition: and((toStartOfMonth(date) in (-Inf, 18597]), (toStartOfMonth(date) in [18597, +Inf))) │
│             Parts: 1/1                                                                                       │
│             Granules: 11/11                                                                                  │
│           PrimaryKey                                                                                         │
│             Keys:                                                                                            │
│               town                                                                                           │
│             Condition: (town in ['LONDON', 'LONDON'])                                                        │
│             Parts: 1/1                                                                                       │
│             Granules: 1/11                                                                                   │
    └──────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

上の出力は、次のことを示しています。 ① パーティションプルーニング: 上記の EXPLAIN 出力の 7 行目から 18 行目は、ClickHouse がまず date フィールドの MinMax index を使って、存在する 3257 個のグラニュール (行のブロック) のうち 11 個を特定し、それらが、クエリの date フィルターに一致する行を含む、436 個あるアクティブなデータパーツのうち 1 個に格納されていることを示しています。 ② Granule pruning: 上記の EXPLAIN 出力の 19 行目から 24 行目は、続いて ClickHouse が、手順 ① で特定されたデータパーツのプライマリインデックス (town フィールドに対して作成されたもの) を使って、グラニュールの数 (クエリの town フィルターにも一致する可能性がある行を含むもの) を 11 から 1 にさらに絞り込むことを示しています。これは、さらに上で表示した、実行したクエリに対する ClickHouse-client の出力にも反映されています。

... Elapsed: 0.006 sec. Processed 8.19 thousand rows, 57.34 KB (1.36 million rows/s., 9.49 MB/s.)
Peak memory usage: 2.73 MiB.

つまり、ClickHouse がクエリ結果の算出にあたり、1 granule (8192 行からなる block) を 6 ミリ秒でスキャンして処理したことを意味します。

パーティション化は主にデータ管理のための機能です

すべてのパーティションをまたぐクエリは、通常、同じクエリをパーティション化されていないテーブルで実行する場合より低速になる点に注意してください。パーティション化すると、データは通常より多くのデータパーツに分散されるため、ClickHouse がより大量のデータをスキャンして処理することになりがちです。これは、同じクエリを What are table parts のサンプルテーブル (パーティション化が有効になっていないもの) と、上で使っている現在のサンプルテーブル (パーティション化が有効なもの) の両方に対して実行すると確認できます。どちらのテーブルにも、同じデータと同じ行数が含まれています: ただし、パーティション化が有効なテーブルには、より多くのアクティブなデータパーツがあります。これは、上で述べたように、ClickHouse はデータパーツをパーティション内ではマージしますが、パーティションをまたいではマージしないためです: さらに上で示したように、パーティション化されたテーブル uk_price_paid_simple_partitioned には 600 を超えるパーティションがあり、そのためアクティブなデータパーツは 600 306 個あります。一方、パーティション化されていないテーブル uk_price_paid_simple では、すべての初期データパーツがバックグラウンドマージによって 1 つのアクティブなパーツにまでマージされました。上記のサンプルクエリをパーティションフィルターなしでパーティション化テーブルに対して実行したときの物理的なクエリ実行計画を、EXPLAIN 句で確認すると、以下の出力の 19 行目と 20 行目から、ClickHouse が既存のグラニュール (行のブロック) 3257 個のうち 671 個を、既存のアクティブなデータパーツ 436 個のうち 431 個にまたがって、クエリのフィルターに一致する行を含む可能性があるものとして特定していることがわかります。したがって、これらがクエリエンジンによってスキャンおよび処理されます:

EXPLAIN indexes = 1
SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple_partitioned
WHERE town = 'LONDON';

    ┌─explain─────────────────────────────────────────────────────────┐
│ Expression ((Project names + Projection))                       │
│   Aggregating                                                   │
│     Expression (Before GROUP BY)                                │
│       Expression                                                │
│         ReadFromMergeTree (uk.uk_price_paid_simple_partitioned) │
│         Indexes:                                                │
│           MinMax                                                │
│             Condition: true                                     │
│             Parts: 436/436                                      │
│             Granules: 3257/3257                                 │
│           Partition                                             │
│             Condition: true                                     │
│             Parts: 436/436                                      │
│             Granules: 3257/3257                                 │
│           PrimaryKey                                            │
│             Keys:                                               │
│               town                                              │
│             Condition: (town in ['LONDON', 'LONDON'])           │
│             Parts: 431/436                                      │
│             Granules: 671/3257                                  │
    └─────────────────────────────────────────────────────────────────┘

パーティションのないテーブルに対して同じサンプルクエリを実行した場合の物理クエリ実行計画の出力の11行目と12行目を見ると、ClickHouse が、そのテーブルの単一のアクティブなデータパーツ内に存在する3083個のブロックのうち241個を、そのクエリのフィルターに一致する行を含む可能性があるものとして特定したことが分かります:

EXPLAIN indexes = 1
SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple
WHERE town = 'LONDON';

    ┌─explain───────────────────────────────────────────────┐
│ Expression ((Project names + Projection))             │
│   Aggregating                                         │
│     Expression (Before GROUP BY)                      │
│       Expression                                      │
│         ReadFromMergeTree (uk.uk_price_paid_simple)   │
│         Indexes:                                      │
│           PrimaryKey                                  │
│             Keys:                                     │
│               town                                    │
│             Condition: (town in ['LONDON', 'LONDON']) │
│             Parts: 1/1                                │
│             Granules: 241/3083                        │
    └───────────────────────────────────────────────────────┘

テーブルのパーティション化されたバージョンに対してクエリを実行すると、ClickHouse は671ブロック分の行 (約550万行) をスキャンして処理し、90ミリ秒で完了します。

SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple_partitioned
WHERE town = 'LONDON';

┌─highest_price─┐
│     594300000 │ -- 5億9430万
└───────────────┘

1 row in set. 経過時間: 0.090 秒。処理済み 5.48 million 行、27.95 MB（60.66 million 行/秒、309.51 MB/秒）。
ピークメモリ使用量: 163.44 MiB。

これに対し、パーティション化されていないテーブルに対してクエリを実行すると、ClickHouse は 241 ブロック (約 200 万行) を 12 ミリ秒でスキャンして処理します。

SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple
WHERE town = 'LONDON';

┌─highest_price─┐
│     594300000 │ -- 5億9,430万
└───────────────┘

1 row in set. Elapsed: 0.012 sec. Processed 1.97 million rows, 9.87 MB (162.23 million rows/s., 811.17 MB/s.)
Peak memory usage: 62.02 MiB.

​ClickHouse におけるテーブルのパーティションとは？

​PARTITION BY

​ディスク上の構造

​パーティションごとのマージ

​パーティションの監視

​テーブルのパーティションは何に使われますか？

​データ管理

​クエリ最適化

​パーティション化は主にデータ管理のための機能です