メインコンテンツまでスキップ
メインコンテンツまでスキップ

azureBlobStorageCluster テーブル関数

指定されたクラスタ内の多くのノードでファイルを並列処理できるようにします。Azure Blob Storage からのファイルです。イニシエーターでクラスター内のすべてのノードへの接続を作成し、S3ファイルパスのアスタリスクを開示し、各ファイルを動的に配信します。ワーカーノードでは、イニシエーターに次の処理タスクを尋ね、それを処理します。すべてのタスクが完了するまで、この処理は繰り返されます。このテーブル関数は、s3Cluster 関数に似ています。

構文

azureBlobStorageCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [account_name, account_key, format, compression, structure])

引数

引数説明
cluster_nameリモートおよびローカルサーバーへのアドレスと接続パラメータのセットを構築するために使用されるクラスタの名前。
connection_stringstorage_account_url` — connection_string にはアカウント名とキーが含まれます (接続文字列の作成)。ここでストレージアカウントのURLを提供し、アカウント名とアカウントキーを別のパラメータとして指定することもできます(パラメータ account_name および account_key を参照)。
container_nameコンテナ名
blobpathファイルパス。読み取り専用モードで次のワイルドカードをサポートします: *, **, ?, {abc,def} および {N..M} 。(ここで、NM は数字、'abc''def' は文字列です。)
account_namestorage_account_url が使用されている場合、ここでアカウント名を指定できます。
account_keystorage_account_url が使用されている場合、ここでアカウントキーを指定できます。
formatファイルの形式
compressionサポートされている値: none, gzip/gz, brotli/br, xz/LZMA, zstd/zst。デフォルトでは、ファイルの拡張子によって圧縮を自動検出します。(auto に設定するのと同じです。)
structureテーブルの構造。形式は 'column1_name column1_type, column2_name column2_type, ...' です。

戻り値

指定された構造のテーブルが返され、指定されたファイルからデータの読み書きができます。

AzureBlobStorage テーブルエンジンと同様に、ユーザーはローカルの Azure Storage 開発に Azurite エミュレーターを使用できます。詳細はこちらを参照してください。以下では、Azurite がホスト名 azurite1 で使用できると仮定します。

cluster_simple クラスター内のすべてのノードを使用して、ファイル test_cluster_*.csv のカウントを選択します:

SELECT count(*) FROM azureBlobStorageCluster(
        'cluster_simple', 'http://azurite1:10000/devstoreaccount1', 'testcontainer', 'test_cluster_count.csv', 'devstoreaccount1',
        'Eby8vdM02xNOcqFlqUwJPLlmEtlCDXJ1OUzFT50uSRZ6IFsuFq2UVErCz4I6tq/K1SZFPTOtr/KBHBeksoGMGw==', 'CSV',
        'auto', 'key UInt64')

共有アクセス署名(SAS)の使用

例については azureBlobStorage を参照してください。