azureBlobStorageCluster テーブル関数
指定したクラスター内の多数のノードで Azure Blob Storage からファイルを並列処理することを可能にします。イニシエーターはクラスター内のすべてのノードへの接続を作成し、S3ファイルパスにアスタリスクを開示し、各ファイルを動的に分配します。ワーカーノードでは、次に処理するタスクについてイニシエーターに尋ね、タスクを処理します。このプロセスは、すべてのタスクが完了するまで繰り返されます。このテーブル関数は s3Cluster 関数 に似ています。
構文
引数
cluster_name
— リモートおよびローカルサーバーへのアドレスと接続パラメータのセットを構築するために使用されるクラスターの名前。connection_string|storage_account_url
— connection_string にはアカウント名とキーが含まれています (接続文字列を作成する) または、ここにストレージアカウントのURLを提供し、アカウント名とアカウントキーを別のパラメータ(account_name と account_key)として提供することもできます。container_name
- コンテナ名blobpath
- ファイルパス。読み取り専用モードで次のワイルドカードをサポートします:*
,**
,?
,{abc,def}
と{N..M}
ここでN
,M
は数字、'abc'
,'def'
は文字列です。account_name
- storage_account_url を使用する場合、ここにアカウント名を指定できます。account_key
- storage_account_url を使用する場合、ここにアカウントキーを指定できます。format
— ファイルの フォーマット。compression
— サポートされている値:none
,gzip/gz
,brotli/br
,xz/LZMA
,zstd/zst
。デフォルトでは、ファイル拡張子によって圧縮を自動検出します。(設定をauto
にするのと同じ)。structure
— テーブルの構造。形式は'column1_name column1_type, column2_name column2_type, ...'
。
返される値
指定されたファイル内のデータを読み書きするための、指定された構造を持つテーブル。
例
AzureBlobStorage テーブルエンジンと同様に、ユーザーはローカル Azure ストレージ開発のために Azurite エミュレーターを使用できます。詳細は こちら を参照してください。ここでは Azurite がホスト名 azurite1
で利用可能であると仮定します。
cluster_simple
クラスター内のすべてのノードを使用してファイル test_cluster_*.csv
のカウントを選択します:
関連項目
共有アクセス Signature (SAS) の使用
例については azureBlobStorage を参照してください。