メインコンテンツまでスキップ
メインコンテンツまでスキップ

ClickHouse Cloudとの統合

はじめに

ClickPipes は、さまざまなデータソースからのデータ取り込みをボタンを数回クリックするだけで簡単に行えるマネージド統合プラットフォームです。最も要求の厳しいワークロード向けに設計されたClickPipesの堅牢でスケーラブルなアーキテクチャは、一貫したパフォーマンスと信頼性を保証します。ClickPipesは長期的なストリーミングニーズや一度限りのデータロードジョブに使用できます。

ClickPipes stack

サポートされているデータソース

名前ロゴ種類ステータス説明
Apache Kafkaストリーミング安定ClickPipesを設定し、Apache KafkaからClickHouse Cloudにストリーミングデータを取り込み始めます。
Confluent Cloudストリーミング安定直接統合を通じてConfluentとClickHouse Cloudの組み合わせたパワーを解き放ちます。
Redpanda
Redpanda logo
ストリーミング安定ClickPipesを設定し、RedpandaからClickHouse Cloudにストリーミングデータを取り込み始めます。
AWS MSKストリーミング安定ClickPipesを設定し、AWS MSKからClickHouse Cloudにストリーミングデータを取り込み始めます。
Azure Event Hubsストリーミング安定ClickPipesを設定し、Azure Event HubsからClickHouse Cloudにストリーミングデータを取り込み始めます。Azure Event Hubs FAQを参照してください。
WarpStreamストリーミング安定ClickPipesを設定し、WarpStreamからClickHouse Cloudにストリーミングデータを取り込み始めます。
Amazon S3オブジェクトストレージ安定ClickPipesを設定し、オブジェクトストレージから大量のデータを取り込みます。
Google Cloud Storageオブジェクトストレージ安定ClickPipesを設定し、オブジェクトストレージから大量のデータを取り込みます。
DigitalOcean Spacesオブジェクトストレージ安定ClickPipesを設定し、オブジェクトストレージから大量のデータを取り込みます。
Azure Blob Storageオブジェクトストレージ安定ClickPipesを設定し、オブジェクトストレージから大量のデータを取り込みます。
Amazon Kinesisストリーミング安定ClickPipesを設定し、Amazon KinesisからClickHouse Cloudにストリーミングデータを取り込み始めます。
PostgresDBMS安定ClickPipesを設定し、PostgresからClickHouse Cloudにデータを取り込み始めます。
MySQLDBMSパブリックベータClickPipesを設定し、MySQLからClickHouse Cloudにデータを取り込み始めます。
MongoDBDBMSプライベートプレビューClickPipesを設定し、MongoDBからClickHouse Cloudにデータを取り込み始めます。

さらに多くのコネクタがClickPipesに追加される予定です。詳細についてはお問い合わせください。

静的IPのリスト

以下は、ClickPipesが外部サービスに接続するために使用する静的NAT IP(地域ごとに区切られています)です。トラフィックを許可するために、関連するインスタンスの地域IPをIP許可リストに追加してください。

すべてのサービスについて、ClickPipesのトラフィックはサービスの場所に基づいてデフォルト地域から発生します:

  • eu-central-1: EU地域のすべてのサービス。 (これにはGCPおよびAzureのEU地域が含まれます)
  • us-east-1: AWS us-east-1のすべてのサービス。
  • ap-south-1: 2025年6月25日以降に作成されたAWS ap-south-1のサービス(この日以前に作成されたサービスはus-east-2のIPを使用します)。
  • ap-southeast-2: 2025年6月25日以降に作成されたAWS ap-southeast-2のサービス(この日以前に作成されたサービスはus-east-2のIPを使用します)。
  • us-west-2: 2025年6月24日以降に作成されたAWS us-west-2のサービス(この日以前に作成されたサービスはus-east-2のIPを使用します)。
  • us-east-2: 明示的にリストされていないすべての地域。 (これにはGCPおよびAzureのUS地域が含まれます)
AWS地域IPアドレス
eu-central-118.195.233.217, 3.127.86.90, 35.157.23.2, 18.197.167.47, 3.122.25.29, 52.28.148.40
us-east-154.82.38.199, 3.90.133.29, 52.5.177.8, 3.227.227.145, 3.216.6.184, 54.84.202.92, 3.131.130.196, 3.23.172.68, 3.20.208.150
us-east-23.131.130.196, 3.23.172.68, 3.20.208.150, 3.132.20.192, 18.119.76.110, 3.134.185.180
ap-south-1 (2025年6月25日以降)13.203.140.189, 13.232.213.12, 13.235.145.208, 35.154.167.40, 65.0.39.245, 65.1.225.89
ap-southeast-2 (2025年6月25日以降)3.106.48.103, 52.62.168.142, 13.55.113.162, 3.24.61.148, 54.206.77.184, 54.79.253.17
us-west-2 (2025年6月24日以降)52.42.100.5, 44.242.47.162, 52.40.44.52, 44.227.206.163, 44.246.241.23, 35.83.230.19

ClickHouse設定の調整

ClickHouse Cloudは、ほとんどのユースケースに対して妥当なデフォルトを提供します。ただし、ClickPipesの宛先テーブルに対してClickHouseの設定を調整する必要がある場合は、ClickPipes用の専用ロールが最も柔軟な解決策です。 手順:

  1. カスタムロール CREATE ROLE my_clickpipes_role SETTINGS ... を作成します。詳細はCREATE ROLEの構文を参照してください。
  2. ClickPipesユーザーにカスタムロールを追加します。ClickPipes作成時の詳細と設定のステップで行います。
Assign a custom role

ClickPipesの高度な設定の調整

ClickPipesは、ほとんどのユースケースの要件をカバーする妥当なデフォルトを提供します。ユースケースによって追加の微調整が必要な場合、次の設定を調整できます。

オブジェクトストレージ ClickPipes

設定デフォルト値説明
Max insert bytes10GB単一の挿入バッチで処理するバイト数。
Max file count100単一の挿入バッチで処理するファイルの最大数。
Max threadsauto(3)ファイル処理の最大同時スレッド数
Max insert threads1ファイル処理の最大同時挿入スレッド数
Min insert block size bytes1GBテーブルに挿入できるブロック内のバイトの最小サイズ
Max download threads4最大同時ダウンロードスレッド数
Object storage polling interval30秒ClickHouseクラスタにデータを挿入する前の最大待機時間を構成します。
Parallel distributed insert select2並列分散挿入選択設定
Parallel view processingfalse順次ではなく同時にアタッチされたビューへのプッシュを有効にするかどうか。
Use cluster functiontrue複数のノード間でファイルを並行処理するかどうか。
Advanced settings for ClickPipes

ストリーミング ClickPipes

設定デフォルト値説明
Streaming max insert wait time5秒ClickHouseクラスタにデータを挿入する前の最大待機時間を構成します。

エラー報告

ClickPipesは、取り込みプロセス中に発生したエラーの種類に応じて2つの異なるテーブルにエラーを格納します。

レコードエラー

ClickPipesは、宛先テーブルの隣に<destination_table_name>_clickpipes_errorという後置詞を持つテーブルを作成します。このテーブルは、形式が正しくないデータやスキーマの不一致からのエラーを含み、無効なメッセージの全文を含みます。このテーブルには7日間のTTLがあります。

システムエラー

ClickPipeの動作に関連するエラーは、system.clickpipes_logテーブルに格納されます。これにより、ネットワーク、接続性などのClickPipeの動作に関連する他のすべてのエラーが保存されます。このテーブルにも7日間のTTLがあります。

ClickPipesが15分後にデータソースに接続できない場合、または1時間後に宛先に接続できない場合、ClickPipesインスタンスは停止し、システムエラーのテーブルに適切なメッセージを保存します(ClickHouseインスタンスが利用可能な場合)。

FAQ

  • ClickPipesとは何ですか?

    ClickPipesは、ユーザーがClickHouseサービスを外部データソース、特にKafkaに接続するのを容易にするClickHouse Cloudの機能です。ClickPipes for Kafkaを使用すると、ユーザーは簡単にデータをClickHouseに継続的にロードし、リアルタイムの分析に利用できるようになります。

  • ClickPipesはデータ変換をサポートしていますか?

    はい、ClickPipesはDDL作成を公開することによって基本的なデータ変換をサポートしています。その後、ClickHouse Cloudサービスの宛先テーブルにデータがロードされる際に、ClickHouseのマテリアライズドビュー機能を利用して、より高度な変換を適用できます。

  • ClickPipesを使用すると追加料金が発生しますか?

    ClickPipesは、取り込まれたデータと計算の2つの次元で請求されます。価格の詳細はこのページで確認できます。ClickPipesを実行すると、宛先のClickHouse Cloudサービスにおいて、他の取り込み作業と同様の間接的な計算およびストレージコストが発生する可能性もあります。

  • ClickPipes for Kafkaを使用する際にエラーや失敗を処理する方法はありますか?

    はい、ClickPipes for Kafkaは、ネットワークの問題、接続の問題などを含む操作上の問題が発生した場合に、自動的に再試行を行います。形式が正しくないデータや無効なスキーマの場合、ClickPipesはレコードをrecord_errorテーブルに保存し、処理を続けます。