azureBlobStorageCluster テーブル関数
指定されたクラスタ内の多くのノードでファイルを並列処理できるようにします。Azure Blob Storage からのファイルです。イニシエーターでクラスター内のすべてのノードへの接続を作成し、S3ファイルパスのアスタリスクを開示し、各ファイルを動的に配信します。ワーカーノードでは、イニシエーターに次の処理タスクを尋ね、それを処理します。すべてのタスクが完了するまで、この処理は繰り返されます。このテーブル関数は、s3Cluster 関数に似ています。
構文
引数
引数 | 説明 |
---|---|
cluster_name | リモートおよびローカルサーバーへのアドレスと接続パラメータのセットを構築するために使用されるクラスタの名前。 |
connection_string | storage_account_url` — connection_string にはアカウント名とキーが含まれます (接続文字列の作成)。ここでストレージアカウントのURLを提供し、アカウント名とアカウントキーを別のパラメータとして指定することもできます(パラメータ account_name および account_key を参照)。 |
container_name | コンテナ名 |
blobpath | ファイルパス。読み取り専用モードで次のワイルドカードをサポートします: * , ** , ? , {abc,def} および {N..M} 。(ここで、N 、M は数字、'abc' 、'def' は文字列です。) |
account_name | storage_account_url が使用されている場合、ここでアカウント名を指定できます。 |
account_key | storage_account_url が使用されている場合、ここでアカウントキーを指定できます。 |
format | ファイルの形式。 |
compression | サポートされている値: none , gzip/gz , brotli/br , xz/LZMA , zstd/zst 。デフォルトでは、ファイルの拡張子によって圧縮を自動検出します。(auto に設定するのと同じです。) |
structure | テーブルの構造。形式は 'column1_name column1_type, column2_name column2_type, ...' です。 |
戻り値
指定された構造のテーブルが返され、指定されたファイルからデータの読み書きができます。
例
AzureBlobStorage テーブルエンジンと同様に、ユーザーはローカルの Azure Storage 開発に Azurite エミュレーターを使用できます。詳細はこちらを参照してください。以下では、Azurite がホスト名 azurite1
で使用できると仮定します。
cluster_simple
クラスター内のすべてのノードを使用して、ファイル test_cluster_*.csv
のカウントを選択します:
共有アクセス署名(SAS)の使用
例については azureBlobStorage を参照してください。