メインコンテンツまでスキップ
メインコンテンツまでスキップ

Delta Lake の統合

ユーザーは、テーブル関数を介して Delta lake テーブルフォーマットと統合できます。

deltaLake テーブル関数

Amazon S3、Azure Blob Storage、またはローカルにマウントされたファイルシステムでの Delta Lake テーブルに対する読み取り専用のテーブルのようなインターフェースを提供します。

構文

deltaLakedeltaLakeS3 の別名であり、互換性のためにサポートされています。

deltaLake(url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])

deltaLakeS3(url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])

deltaLakeAzure(connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])

deltaLakeLocal(path, [,format])

引数

引数の説明は、テーブル関数 s3azureBlobStorageHDFS および file の引数の説明と一致します。format は Delta Lake テーブル内のデータファイルの形式を示します。

戻り値

指定された Delta Lake テーブルからデータを読み取るための指定された構造のテーブル。

S3 https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/ からのテーブルの行を選択する:

SELECT
    URL,
    UserAgent
FROM deltaLake('https://clickhouse-public-datasets.s3.amazonaws.com/delta_lake/hits/')
WHERE URL IS NOT NULL
LIMIT 2
┌─URL───────────────────────────────────────────────────────────────────┬─UserAgent─┐
│ http://auto.ria.ua/search/index.kz/jobinmoscow/detail/55089/hasimages │         1 │
│ http://auto.ria.ua/search/index.kz/jobinmoscow.ru/gosushi             │         1 │
└───────────────────────────────────────────────────────────────────────┴───────────┘

仮想カラム

  • _path — ファイルへのパス。型: LowCardinality(String)
  • _file — ファイル名。型: LowCardinality(String)
  • _size — ファイルサイズ(バイト単位)。型: Nullable(UInt64)。ファイルサイズが不明な場合、値は NULL です。
  • _time — ファイルの最終変更時刻。型: Nullable(DateTime)。時刻が不明な場合、値は NULL です。
  • _etag — ファイルのetag。型: LowCardinality(String)。etagが不明な場合、値は NULL です。