deltaLakeCluster テーブル関数
これは deltaLake テーブル関数の拡張です。
指定されたクラスター内の多数のノードから Amazon S3 の Delta Lake テーブルのファイルを並列に処理できるようにします。イニシエーター上で、クラスター内のすべてのノードへの接続を作成し、各ファイルを動的に配信します。ワーカーノードでは、イニシエーターに次の処理タスクを尋ね、そのタスクを処理します。すべてのタスクが完了するまでこのプロセスは繰り返されます。
構文
deltaLakeS3Cluster
は deltaLakeCluster
のエイリアスであり、どちらも S3 用です。
引数
-
cluster_name
— リモートおよびローカルサーバーへのアドレスと接続パラメータのセットを構築するために使用されるクラスターの名前。 -
その他すべての引数の説明は、対応する deltaLake テーブル関数の引数の説明と一致します。
戻り値
指定された Delta Lake テーブルからクラスターのデータを読み取るための指定された構造のテーブル。
仮想カラム
_path
— ファイルのパス。タイプ:LowCardinality(String)
。_file
— ファイルの名前。タイプ:LowCardinality(String)
。_size
— ファイルのサイズ(バイト単位)。タイプ:Nullable(UInt64)
。ファイルサイズが不明な場合、値はNULL
です。_time
— ファイルの最終変更時刻。タイプ:Nullable(DateTime)
。時間が不明な場合、値はNULL
です。_etag
— ファイルの etag。タイプ:LowCardinality(String)
。etag が不明な場合、値はNULL
です。