Iceberg テーブルエンジン

注意

ClickHouseでIcebergデータを扱うためには、Iceberg テーブル関数の使用を推奨します。Iceberg テーブル関数は現在、Iceberg テーブルに対して部分的な読み取り専用インターフェースを提供する十分な機能を備えています。

Iceberg テーブルエンジンは利用可能ですが、制限がある場合があります。ClickHouseは元々、外部で変更されるスキーマを持つテーブルをサポートするように設計されていないため、Iceberg テーブルエンジンの機能に影響を与える可能性があります。その結果、通常のテーブルで動作する機能の一部が利用できないか、正しく機能しない場合があります。特に古いアナライザーを使用している場合です。

最適な互換性のために、Iceberg テーブルエンジンのサポートを改善し続ける間、Iceberg テーブル関数の使用をお勧めします。

このエンジンは、Amazon S3、Azure、HDFS、およびローカルに保存されたテーブルにある既存のApache Iceberg テーブルとの読み取り専用統合を提供します。

テーブル作成

Icebergテーブルはストレージ内に既に存在している必要があります。このコマンドは新しいテーブルを作成するためのDDLパラメータを取らないことに注意してください。

エンジン引数

引数の説明は、エンジン S3、AzureBlobStorage、HDFS および File の引数の説明と一致します。 format はIcebergテーブルのデータファイルのフォーマットを表します。

エンジンパラメータは、Named Collectionsを使用して指定できます。

例

名前付きコレクションを使用する場合：

エイリアス

テーブルエンジン Iceberg は現時点で IcebergS3 のエイリアスです。

スキーマ進化

現在、CHを使用すると、時間とともにスキーマが変更されたIcebergテーブルを読み取ることができます。現在、列の追加や削除、列の順序変更が行われたテーブルの読み取りをサポートしています。また、値が必須のカラムをNULLを許可するカラムに変更することも可能です。さらに、次の単純型に対する型キャストをサポートしています：

int -> long
float -> double
decimal(P, S) -> decimal(P', S) ただし P' > P。

現在、ネストされた構造や配列およびマップ内の要素の型を変更することはできません。

スキーマが作成後に変更されたテーブルを動的スキーマ推論で読み取るには、テーブルの作成時に allow_dynamic_metadata_for_data_lakes = true を設定します。

パーティションプルーニング

ClickHouseはIcebergテーブルに対するSELECTクエリ中にパーティションプルーニングをサポートしており、これにより無関係なデータファイルをスキップすることでクエリパフォーマンスを最適化します。パーティションプルーニングを有効にするには、 use_iceberg_partition_pruning = 1 を設定します。Icebergパーティションプルーニングの詳細については、https://iceberg.apache.org/spec/#partitioningにアクセスしてください。

タイムトラベル

ClickHouseはIcebergテーブルに対するタイムトラベルをサポートしており、特定のタイムスタンプまたはスナップショットIDを使用して過去のデータをクエリすることができます。

基本的な使い方

注意：同一のクエリで iceberg_timestamp_ms と iceberg_snapshot_id の両方のパラメータを指定することはできません。

重要な考慮事項

スナップショット は通常、以下のときに作成されます：
- テーブルに新しいデータが書き込まれるとき
- 何らかのデータ圧縮が行われるとき
スキーマの変更は通常スナップショットを作成しません - これは、スキーマ進化が行われたテーブルでタイムトラベルを使用するときに重要な挙動につながります。

例となるシナリオ

すべてのシナリオはSparkで記述されています。ClickHouseは現在Icebergテーブルへの書き込みをサポートしていないためです。

シナリオ 1: 新しいスナップショットなしのスキーマ変更

以下の操作のシーケンスを考えます：

異なるタイムスタンプでのクエリ結果：

ts1 と ts2 では、オリジナルの2つの列のみが表示されます。
ts3では、すべての3つの列が表示され、最初の行の価格はNULLになります。

シナリオ 2: 過去のスキーマと現在のスキーマの違い

現在の瞬間でのタイムトラベルクエリは、現在のテーブルとは異なるスキーマを示す場合があります：

これは、ALTER TABLE が新しいスナップショットを作成しないために発生しますが、現在のテーブルに対してSparkは最新のメタデータファイルから schema_id の値を取得するためです。

シナリオ 3: 過去のスキーマと現在のスキーマの違い

もう一つは、タイムトラベルを行っているときに、任意のデータが書き込まれる前のテーブルの状態を取得できないことです：

Clickhouseの動作はSparkと一貫しています。SparkのSelectクエリをClickhouseのSelectクエリに置き換えることができ、同じように機能します。

メタデータファイルの解決

ClickHouseでIcebergテーブルエンジンを使用する際、システムはIcebergテーブルの構造を記述した正しいmetadata.jsonファイルを見つける必要があります。この解決プロセスの仕組みは次のとおりです。

候補の検索（優先順）

直接パスの指定:
- iceberg_metadata_file_path を設定すると、システムはこの正確なパスをIcebergテーブルのディレクトリパスと組み合わせて使用します。
- この設定が提供されると、他の解決設定は無視されます。
テーブルUUIDの一致:
- iceberg_metadata_table_uuid が指定されている場合、システムは：
  - metadata ディレクトリ内の .metadata.json ファイルのみを調べます。
  - 指定したUUIDと一致する table-uuid フィールドを含むファイルをフィルタリングします（大文字と小文字を区別しません）。
デフォルトの検索:
- 上記の設定がいずれも提供されていない場合、metadata ディレクトリ内のすべての .metadata.json ファイルが候補になります。

データキャッシュ

Iceberg テーブルエンジンおよびテーブル関数は、 S3、AzureBlobStorage、HDFS ストレージと同様にデータキャッシングをサポートしています。詳しくはこちら。

メタデータキャッシュ

Iceberg テーブルエンジンおよびテーブル関数は、マニフェストファイル、マニフェストリスト、メタデータjsonの情報を保存するメタデータキャッシュをサポートしています。キャッシュはメモリ内に保存されます。この機能は use_iceberg_metadata_files_cache を設定することで制御されており、デフォルトで有効になっています。

参照

iceberg テーブル関数

テーブル作成​

エンジン引数​

例​

エイリアス​

スキーマ進化​

パーティションプルーニング​

タイムトラベル​

基本的な使い方​

重要な考慮事項​

例となるシナリオ​

シナリオ 1: 新しいスナップショットなしのスキーマ変更​

シナリオ 2: 過去のスキーマと現在のスキーマの違い​

シナリオ 3: 過去のスキーマと現在のスキーマの違い​

メタデータファイルの解決​

候補の検索（優先順）​

最新のファイルの選択​

データキャッシュ​

メタデータキャッシュ​

参照​