メインコンテンツまでスキップ
メインコンテンツまでスキップ

DataLakeCatalog

DataLakeCatalog データベースエンジンを使用すると、ClickHouse を外部データカタログに接続し、データの重複なしにオープンテーブルフォーマットデータをクエリできます。これにより、ClickHouse は既存のデータレイクインフラストラクチャとシームレスに連携する強力なクエリエンジンへと変貌します。

Supported catalogs

DataLakeCatalog エンジンは、以下のデータカタログをサポートしています:

  • AWS Glue Catalog - AWS 環境における Iceberg テーブル用
  • Databricks Unity Catalog - Delta Lake および Iceberg テーブル用
  • Hive Metastore - 従来の Hadoop エコシステムカタログ
  • REST Catalogs - Iceberg REST 仕様をサポートする任意のカタログ

Creating a database

DataLakeCatalog エンジンを使用するには、以下の関連設定を有効にする必要があります。

SET allow_experimental_database_iceberg = 1;
SET allow_experimental_database_unity_catalog = 1;
SET allow_experimental_database_glue_catalog = 1;
SET allow_experimental_database_hms_catalog = 1;

DataLakeCatalog エンジンを使用してデータベースを作成するには、以下の構文を使用できます:

CREATE DATABASE database_name
ENGINE = DataLakeCatalog(catalog_endpoint[, user, password])
SETTINGS
catalog_type,
[...]

サポートされている設定は次のとおりです:

設定説明
catalog_typeカタログの種類: glueunity (Delta)、rest (Iceberg)、hive
warehouseカタログで使用するウェアハウス/データベース名。
catalog_credentialカタログ用の認証資格情報 (例: API キーまたはトークン)
auth_headerカタログサービスとの認証用のカスタム HTTP ヘッダー
auth_scope認証用の OAuth2 スコープ (OAuth を使用する場合)
storage_endpoint基盤となるストレージのエンドポイント URL
oauth_server_uri認証のための OAuth2 認可サーバーの URI
vended_credentialsベンダー提供の資格情報を使用するかどうかを示すブール値 (AWS 特有)
aws_access_key_idS3/Glue アクセス用の AWS アクセスキー ID (ベンダー提供の資格情報を使用しない場合)
aws_secret_access_keyS3/Glue アクセス用の AWS シークレットアクセスキー (ベンダー提供の資格情報を使用しない場合)
regionサービスの AWS リージョン (例: us-east-1)

Examples

以下のページに DataLakeCatalog エンジンの使用例があります: