メインコンテンツまでスキップ
メインコンテンツまでスキップ

azureBlobStorageCluster テーブル関数

指定したクラスター内の多数のノードで Azure Blob Storage からファイルを並列処理することを可能にします。イニシエーターはクラスター内のすべてのノードへの接続を作成し、S3ファイルパスにアスタリスクを開示し、各ファイルを動的に分配します。ワーカーノードでは、次に処理するタスクについてイニシエーターに尋ね、タスクを処理します。このプロセスは、すべてのタスクが完了するまで繰り返されます。このテーブル関数は s3Cluster 関数 に似ています。

構文

引数

  • cluster_name — リモートおよびローカルサーバーへのアドレスと接続パラメータのセットを構築するために使用されるクラスターの名前。
  • connection_string|storage_account_url — connection_string にはアカウント名とキーが含まれています (接続文字列を作成する) または、ここにストレージアカウントのURLを提供し、アカウント名とアカウントキーを別のパラメータ(account_name と account_key)として提供することもできます。
  • container_name - コンテナ名
  • blobpath - ファイルパス。読み取り専用モードで次のワイルドカードをサポートします: *, **, ?, {abc,def}{N..M} ここで N, M は数字、'abc', 'def' は文字列です。
  • account_name - storage_account_url を使用する場合、ここにアカウント名を指定できます。
  • account_key - storage_account_url を使用する場合、ここにアカウントキーを指定できます。
  • format — ファイルの フォーマット
  • compression — サポートされている値: none, gzip/gz, brotli/br, xz/LZMA, zstd/zst。デフォルトでは、ファイル拡張子によって圧縮を自動検出します。(設定を auto にするのと同じ)。
  • structure — テーブルの構造。形式は 'column1_name column1_type, column2_name column2_type, ...'

返される値

指定されたファイル内のデータを読み書きするための、指定された構造を持つテーブル。

AzureBlobStorage テーブルエンジンと同様に、ユーザーはローカル Azure ストレージ開発のために Azurite エミュレーターを使用できます。詳細は こちら を参照してください。ここでは Azurite がホスト名 azurite1 で利用可能であると仮定します。

cluster_simple クラスター内のすべてのノードを使用してファイル test_cluster_*.csv のカウントを選択します:

関連項目

共有アクセス Signature (SAS) の使用

例については azureBlobStorage を参照してください。