deltaLakeCluster テーブル関数
これは deltaLake テーブル関数の拡張です。
指定したクラスタ内の多数のノードから、Amazon S3 上の Delta Lake テーブルのファイルを並列処理できるようにします。イニシエーターはクラスタ内のすべてのノードへの接続を確立し、各ファイルを動的に割り振ります。ワーカーノードは、処理すべき次のタスクについてイニシエーターに問い合わせ、そのタスクを処理します。すべてのタスクが完了するまで、これが繰り返されます。
構文
deltaLakeS3Cluster は deltaLakeCluster のエイリアスであり、どちらも S3 向けです。`
引数
-
cluster_name— リモートおよびローカルサーバーへのアドレスや接続パラメータのセットを構成するために使用されるクラスタの名前。 -
その他すべての引数の説明は、同等の deltaLake テーブル関数における引数の説明と同一です。
返される値
S3 内の指定された Delta Lake テーブルのうち、クラスタからデータを読み取るために指定された構造を持つテーブル。
仮想カラム
_path— ファイルへのパス。型:LowCardinality(String)。_file— ファイル名。型:LowCardinality(String)。_size— ファイルのサイズ(バイト単位)。型:Nullable(UInt64)。ファイルサイズが不明な場合、値はNULLになります。_time— ファイルの最終更新時刻。型:Nullable(DateTime)。時刻が不明な場合、値はNULLになります。_etag— ファイルの ETag。型:LowCardinality(String)。ETag が不明な場合、値はNULLになります。