ウェアハウス - ClickHouse Documentation

コンピュート分離とは？

コンピュート分離について説明する前に、ClickHouse Cloud におけるサービスとは何かを理解しておくとわかりやすいでしょう。各 ClickHouse Cloud サービスには、次のものが含まれます。

専用の CPU とメモリクラスターを備えた ClickHouse のコンピュートノード (レプリカと呼ばれます)
サービスに接続するためのエンドポイント (または ClickHouse Cloud の UI コンソールから作成された複数のエンドポイント) 。ローカル接続やサードパーティアプリからの接続に使用します (例: https://dv2fzne24g.us-east-1.aws.clickhouse.cloud:8443)
サービスがすべてのデータとメタデータの一部を保存するオブジェクトストレージフォルダー:

図 1 - ClickHouse Cloud 内の単一サービス 単一のサービスだけでなく、同じ共有ストレージにアクセスできる複数のサービスを作成することもできます。これにより、データを複製することなく、特定のワークロードに専用のリソースを割り当てられます。この考え方をコンピュート分離と呼びます。コンピュート分離では、各サービスがそれぞれ独自のレプリカ群とエンドポイントを持ちながら、同じオブジェクトストレージフォルダーを使用し、同じテーブルやビューなどにアクセスします。つまり、ワークロードに適したサイズのコンピュートを選択できます。小規模なレプリカ 1 つで十分なワークロードもあれば、完全な高可用性 (HA) と、複数のレプリカにまたがる数百 GB のメモリを必要とするワークロードもあります。また、コンピュート分離を使うことで、読み取り処理と書き込み処理を分離し、相互に干渉しないようにすることもできます。
図 2 - ClickHouse Cloud におけるコンピュート分離

ウェアハウスとは何ですか？

ClickHouse Cloud では、ウェアハウス とは同じデータを共有するサービスの集合です。各ウェアハウスには、プライマリサービス (最初に作成されるサービス) と、1 つ以上のセカンダリサービスがあります。たとえば、以下のスクリーンショットでは、2 つのサービスで構成されるウェアハウス「DWH Prod」を確認できます。

プライマリサービス DWH Prod
セカンダリサービス DWH Prod Subservice

図 3 - ウェアハウスの例 ウェアハウス内のすべてのサービスは、以下を共有します。

Region (例: us-east1)
クラウドサービスプロバイダー (AWS、GCP、または Azure)
ClickHouse データベースのバージョン
ClickHouse Keeper (レプリカの管理用)

アクセス制御

データベース認証情報

ウェアハウス内のすべてのサービスは同じテーブル群を共有するため、サービス間でアクセス制御も共有されます。つまり、Service 1 で作成されたすべてのデータベースユーザーは、同じ権限 (テーブルやビューなどに対する grants) で Service 2 も利用でき、その逆も同様です。各サービスで使用するエンドポイントは異なりますが、ユーザー名とパスワードはすべてのサービスで共通です。つまり、以下の図に示すように、同じストレージを使用するサービス間ではユーザーが共有されます。
図 4 - ユーザー Alice は Service 1 で作成されましたが、同じ認証情報を使って、同じデータを共有するすべてのサービスにアクセスできます

ネットワークアクセス制御

他のアプリケーションや一時的なユーザーによる特定のサービスへのアクセスを制限するには、ネットワーク制限を適用できます。そのためには、ClickHouse Cloudコンソールで、アクセスを制限したいサービスのタブにあるSettingsに移動します。 IP フィルタリング設定はサービスごとに個別に適用できるため、どのアプリケーションがどのサービスにアクセスできるかを制御できます。これにより、ユーザーが特定のサービスを利用できないように制限できます。以下の例では、Alice はウェアハウス内のサービス 2 へのアクセスを制限されています。
図 5 - Alice は、ネットワークアクセス制御の設定によりサービス 2 へのアクセスを制限されています また、ユーザーが default ユーザーではなく個別のユーザーとして接続する場合は、ClickHouse のロールと権限を適用してデータへのアクセスを制御することもできます。

読み取り専用サービスと読み書きサービス

サービスの種類は次のいずれかです。

読み書き
- ClickHouse に対してデータの読み取りと書き込みの両方が可能
- バックグラウンドマージ処理 (例: データ挿入後のパーツのマージ) を実行するため、CPU とメモリを消費する
- データを外部にエクスポートできる
読み取り専用
- データの読み取りのみ可能で、ClickHouse 内のデータの書き込みや変更はできない
- システムテーブルを除きバックグラウンドマージ処理を実行しないため、リソースを読み取りクエリに全面的に使える
- 外部へのデータエクスポート (例: テーブル関数経由) は引き続き可能だが、ClickHouse 内のデータは変更できない
- バックグラウンドマージによって稼働状態が維持されることがある読み書きサービスとは異なり、すぐにアイドル状態になる

重要な読み取りワークロードを、書き込みやマージのオーバーヘッドから切り離すために、サービスを読み取り専用にしたい場合があります。これは 2 つ目のサービスと、それ以降に作成する追加サービスで設定できます。ただし、最初のサービスは常に読み書きサービスです。以下の図を参照してください。
図 6 - ウェアハウス内の読み書きサービスと読み取り専用サービス

読み取り専用サービスは現在、ユーザー管理操作 (CREATE、DROP など) をサポートしています。
リフレッシュ可能なマテリアライズドビューは、ウェアハウス内の読み書き (RW) サービスでのみ実行されます。
サービスのタイプ (読み取り専用または読み書き) は作成時に固定され、その後 Cloud Console から変更することはできません。読み取り専用と読み書きを切り替えるには、ウェアハウス内に希望するタイプの新しいサービスを作成してください。

スケーリング

ウェアハウス内の各サービスは、次の項目についてワークロードに合わせて調整できます。

ノード数 (レプリカ数) 。プライマリサービス (ウェアハウス内で最初に作成されたサービス) は 2 ノード以上である必要があります。各セカンダリサービスは 1 ノード以上にできます。
ノード (レプリカ) のサイズ
サービスを自動的にスケーリングするかどうか (水平および垂直)
非アクティブ時にサービスをアイドル状態にするかどうか

詳細については、“オートスケーリング” ページを参照してください。

`clusterAllReplicas` の動作の変更

1 つのウェアハウスに複数のサービスがあると、clusterAllReplicas() の動作が変わります。 default クラスター名を使用した場合、対象になるのはウェアハウス内のすべてのサービスではなく、現在のサービスに属するレプリカのみです。たとえば、サービス 1 から clusterAllReplicas(default, system, processes) を呼び出すと、返されるのはサービス 1 上で実行中のプロセスだけです。ウェアハウス内のすべてのサービスをまたいでクエリを実行するには、代わりに all_groups.default クラスター名を使用してください。

SELECT * FROM clusterAllReplicas('all_groups.default', system, processes)

セカンダリのシングルノードサービスは垂直スケーリングできますが、プライマリのシングルノードサービスはできません。

制限事項

ワークロード分離の制限事項

一部のワークロードは特定のサービスに分離できません。つまり、あるサービス上のワークロードが、同じウェアハウス内の別のサービスに影響するケースがあります。具体的には、次のようなものがあります。

すべての読み書きサービスは、デフォルトでバックグラウンドマージ処理を実行します。 ClickHouse にデータを挿入すると、データベースはまずデータを一時的なパーティションに書き込み、その後バックグラウンドでマージを実行します。これらのマージは、メモリや CPU リソースを消費することがあります。2 つの読み書きサービスが同じストレージを共有している場合、両方のサービスでバックグラウンド処理が実行されます。つまり、Service 1 で INSERT クエリが実行されても、そのマージ処理自体は Service 2 で完了することがあります。読み取り専用サービスはバックグラウンドマージを実行しないため、この処理にリソースを消費しない点に注意してください。なお、サポートではサービス上のマージを無効にすることもできます。
すべての読み書きサービスで S3Queue テーブルエンジンの insert 操作が実行されます。 読み書きサービス上に S3Queue テーブルを作成すると、そのウェアハウス内の他のすべての読み書きサービスでも、S3 からのデータの読み取りとデータベースへの書き込みが実行される場合があります。
idling が有効な場合、ある読み書きサービスでの inserts によって、別の読み書きサービスがアイドル状態に移行できなくなることがあります。 あるサービスが、別のサービスのためにバックグラウンドマージ処理を実行する場合があります。こうしたバックグラウンド処理によって、後者のサービスがアイドル状態に移行できなくなることがあります。バックグラウンド処理が完了すると、そのサービスはアイドル状態になります。読み取り専用サービスは影響を受けません。

参考情報

ClickHouse のバージョン: アップグレードスケジュールは、プライマリサービスの設定によって決まります。セカンダリサービスに、プライマリサービスとは独立したリリーススケジュールを設定することはできません。
CREATE/RENAME/DROP DATABASE クエリは、デフォルトでアイドル化または停止中のサービスによってブロックされることがあります。 サービスがアイドル化または停止中のときにこれらのクエリを実行すると、処理がハングする場合があります。これを回避するには、セッション単位またはクエリ単位で settings distributed_ddl_task_timeout=0 を指定して、データベース管理クエリを実行できます。

たとえば:

CREATE DATABASE db_test_ddl_single_query_setting
SETTINGS distributed_ddl_task_timeout=0

サービスを手動で停止した場合、クエリを実行するには再度起動する必要があります。

単一レプリカのプライマリサービス 現在のデフォルト動作では、セカンダリサービスはレプリカを 1 つにできますが、プライマリサービスには少なくとも 2 つのレプリカが必要です。単一レプリカのプライマリサービスを有効にするには、サポートにお問い合わせください。この動作は 2026 年第 2 四半期にデフォルトで有効になる予定です。
プライマリサービスのアイドル化: プライマリサービスの自動アイドル化はデフォルトで有効になっています。

料金

コンピュートの価格は、1 つのウェアハウス内のすべてのサービス (プライマリおよびセカンダリ) で共通です。ストレージ料金が課金されるのは 1 回のみで、最初の (元の) サービスに含まれます。ワークロードの規模と選択したティアに基づいてコストを見積もるには、pricing ページの料金計算ツールを参照してください。Usage Breakdown テーブルには、サービスごとのコンピュートコストの内訳が表示されます。

バックアップ

1 つのウェアハウス内のすべてのサービスは同じストレージを共有するため、バックアップはプライマリ (初期) サービスでのみ作成されます。これにより、ウェアハウス内のすべてのサービスのデータがバックアップされます。
ウェアハウスのプライマリサービスからバックアップを復元すると、既存のウェアハウスには接続されていない、まったく新しいサービスとして復元されます。復元が完了したらすぐに、その新しいサービスにさらにサービスを追加できます。

ウェアハウスの設定方法

ウェアハウスの作成

ウェアハウスを作成するには、既存のサービスとデータを共有する 2 つ目のサービスを作成する必要があります。これは、既存のサービスのいずれかにあるプラス記号をクリックして行えます。
図 7 - プラス記号をクリックして、ウェアハウス内に新しいサービスを作成します サービス作成画面では、新しいサービスのデータ元として、元のサービスがドロップダウンで選択された状態になります。作成後、これら 2 つのサービスで 1 つのウェアハウスが構成されます。

ウェアハウス名の変更

ウェアハウス名を変更する方法は 2 つあります。

services ページの右上にある「Sort by warehouse」を選択し、ウェアハウス名の横にある鉛筆アイコンをクリックします
いずれかのサービスでウェアハウス名をクリックし、そこで名前を変更できます

ウェアハウスの削除

ウェアハウスを削除すると、すべてのコンピュートサービスとデータ (テーブル、ビュー、ユーザーなど) が削除されます。この操作は元に戻せません。ウェアハウスを削除できるのは、最初に作成したサービスを削除する場合のみです。手順は次のとおりです。

最初に作成したサービス以外の、すべてのサービスを削除します。
最初のサービスを削除します (警告: この手順ですべてのウェアハウスデータが削除されます) 。

​コンピュート分離とは？

​ウェアハウス とは何ですか？

​アクセス制御

​データベース認証情報

​ネットワークアクセス制御

​読み取り専用サービスと読み書きサービス

​スケーリング

​clusterAllReplicas の動作の変更

​制限事項

​ワークロード分離の制限事項

​参考情報

​料金

​バックアップ

​ウェアハウス の設定方法

​ウェアハウスの作成

​ウェアハウス名の変更

​ウェアハウスの削除

コンピュート分離とは？

ウェアハウスとは何ですか？

アクセス制御

データベース認証情報

ネットワークアクセス制御

読み取り専用サービスと読み書きサービス

スケーリング

`clusterAllReplicas` の動作の変更

制限事項

ワークロード分離の制限事項

参考情報

料金

バックアップ

ウェアハウスの設定方法

ウェアハウスの作成

ウェアハウス名の変更

ウェアハウスの削除