MongoDB から ClickHouse へのデータのインジェスト(CDC(変更データキャプチャ)を使用)
ClickPipes を使用して MongoDB から ClickHouse Cloud へデータを取り込む機能は、パブリックベータ版です。
ClickHouse Cloud のコンソールおよびドキュメントでは、MongoDB に対して「table」と「collection」を同じ意味で使用します。
ClickPipes を使用して、MongoDB データベースから ClickHouse Cloud にデータを取り込むことができます。送信元の MongoDB データベースは、オンプレミス環境にホストされていても、MongoDB Atlas などのサービスを利用してクラウド上にホストされていても構いません。
MongoDB ClickPipes は、ClickPipes UI を使用して手動でデプロイおよび管理できるほか、OpenAPI や Terraform を使用してプログラムからデプロイおよび管理することもできます。
前提条件
開始する前に、まず MongoDB データベースがレプリケーション用に正しく構成されていることを確認する必要があります。構成手順は MongoDB のデプロイ方法によって異なるため、以下の該当するガイドに従ってください。
ソースとなる MongoDB データベースのセットアップが完了したら、ClickPipe の作成に進むことができます。
ClickPipe を作成する
ClickHouse Cloud アカウントにログインしていることを確認してください。まだアカウントをお持ちでない場合は、こちらからサインアップできます。
- ClickHouse Cloud コンソールで、対象の ClickHouse Cloud Service に移動します。

- 左側メニューから
Data Sourcesボタンを選択し、「Set up a ClickPipe」をクリックします。

MongoDB CDCタイルを選択します。

ソース MongoDB データベース接続の追加
-
事前準備の手順で設定したソース MongoDB データベースの接続情報を入力します。
情報接続情報の入力を始める前に、ファイアウォールルールで ClickPipes の IP アドレスをホワイトリストに登録していることを確認してください。次のページで ClickPipes の IP アドレス一覧 を確認できます。 詳細については、このページの冒頭 にリンクされているソース MongoDB セットアップガイドを参照してください。

(オプション)SSH トンネリングを設定する
ソースの MongoDB データベースがインターネットから直接アクセスできない場合は、SSH トンネリングの詳細を指定できます。
-
"Use SSH Tunnelling" トグルを有効にします。
-
SSH 接続情報を入力します。

-
鍵ベース認証を使用するには、"Revoke and generate key pair" をクリックして新しいキーペアを生成し、生成された公開鍵を SSH サーバー上の
~/.ssh/authorized_keysにコピーします。 -
"Verify Connection" をクリックして接続を確認します。
SSH バスティオンホストに対するファイアウォールルールで ClickPipes IP addresses を必ずホワイトリストに追加し、ClickPipes が SSH トンネルを確立できるようにしてください。
接続情報の入力が完了したら、Next をクリックします。
詳細設定を構成する
必要に応じて詳細設定を構成できます。各設定の簡単な説明は以下のとおりです。
- Sync interval: ClickPipes がソースデータベースの変更をポーリングする間隔です。この値は宛先の ClickHouse サービスへの影響があり、コストを重視するユーザーには、この値を高め(
3600以上)に設定しておくことを推奨します。 - Pull batch size: 1 回のバッチで取得する行の数です。これはベストエフォートの設定であり、常にこの値どおりになるとは限りません。
- Snapshot number of tables in parallel: 初回スナップショット時に並列で取得するテーブル数です。多数のテーブルがあり、並列で取得するテーブル数を制御したい場合に有用です。
テーブルを構成する
-
ここでは、ClickPipe の送信先データベースを選択できます。既存のデータベースを選択するか、新しいデータベースを作成することができます。

-
ソースの MongoDB データベースからレプリケーション対象とするテーブルを選択できます。テーブルを選択する際、送信先の ClickHouse データベース内でテーブル名を変更することもできます。
権限を確認し、ClickPipe を開始する
-
権限のドロップダウンメニューから「Full access」ロールを選択し、「Complete Setup」をクリックします。

次のステップ
MongoDB から ClickHouse Cloud へのデータをレプリケートするための ClickPipe のセットアップが完了したら、最適なパフォーマンスを得られるよう、データのクエリおよびモデリングをどのように行うかに注力できます。
注意事項
このコネクタを使用する際の注意点は以下のとおりです。
- MongoDB バージョン 5.1.0 以上が必要です。
- CDC(変更データキャプチャ)のために MongoDB のネイティブな Change Streams API を使用しており、MongoDB の oplog に依存してリアルタイムの変更を取得します。
- MongoDB からのドキュメントは、デフォルトでは ClickHouse では JSON 型としてレプリケートされます。これにより柔軟なスキーマ管理が可能になり、ClickHouse の豊富な JSON 演算子セットをクエリや分析に利用できます。JSON データのクエリ方法についてはこちらを参照してください。
- セルフサービスでの PrivateLink 構成は現在利用できません。AWS 上で PrivateLink が必要な場合は、[email protected] までご連絡いただくか、サポートチケットを作成してください。弊社にて有効化できるよう調整いたします。