メインコンテンツまでスキップ
メインコンテンツまでスキップ

hudiCluster テーブル関数

これはこちらの hudi テーブル関数への拡張です。

指定されたクラスタ内の多くのノードと並行して、Amazon S3 の Apache Hudi テーブルからファイルを処理できるようにします。イニシエーターは、クラスタ内のすべてのノードへの接続を作成し、各ファイルを動的にディスパッチします。ワーカーノードでは、イニシエーターに次の処理タスクについて尋ね、そのタスクを処理します。これをすべてのタスクが終了するまで繰り返します。

構文

引数

引数説明
cluster_nameリモートおよびローカルサーバへのアドレスと接続パラメータのセットを構築するために使用されるクラスタの名前。
urlS3 に存在する Hudi テーブルへのパスを含むバケット URL。
aws_access_key_id, aws_secret_access_keyAWS アカウントユーザーのための長期認証情報。これを使ってリクエストを認証できます。これらのパラメータはオプションです。認証情報が指定されていない場合、ClickHouse 設定から使用されます。詳細については、データストレージに S3 を使用するを参照してください。
formatファイルの format
structureテーブルの構造。形式 'column1_name column1_type, column2_name column2_type, ...'
compressionパラメータはオプションです。サポートされている値: none, gzip/gz, brotli/br, xz/LZMA, zstd/zst。デフォルトでは、圧縮はファイル拡張子によって自動的に検出されます。

戻り値

指定された Hudi テーブルからクラスタのデータを読み取るための、指定された構造のテーブル。