メインコンテンツへスキップ
メインコンテンツへスキップ

バックアップの確認と復元

このガイドでは、ClickHouse Cloud におけるバックアップの動作、サービスのバックアップ構成に利用できるオプション、およびバックアップからの復元方法について説明します。

前提条件

バックアップステータス一覧

サービスは、デフォルトの日次スケジュールか、ユーザーが選択したカスタムスケジュールかに関わらず、設定されたスケジュールに基づいてバックアップされます。利用可能なすべてのバックアップは、サービスの Backups タブから確認できます。ここでは、バックアップのステータス、所要時間、およびバックアップサイズを確認できます。Actions カラムを使用して、特定のバックアップを復元することもできます。

ClickHouse Cloud におけるバックアップステータス一覧

バックアップコストの把握

デフォルトポリシーでは、ClickHouse Cloud は 24 時間の保持期間で毎日 1 回のバックアップを必須とします。より多くのデータを保持するスケジュールを選択したり、より頻繁にバックアップを実行するようにすると、バックアップ用ストレージの料金が追加で発生する可能性があります。

バックアップコストを把握するには、使用状況画面からサービスごとのバックアップコストを表示できます(下図参照)。カスタマイズしたスケジュールで数日間バックアップを実行すれば、コストの目安が分かるようになり、その値からバックアップの月額コストを概算できます。

ClickHouse Cloud におけるバックアップ使用量チャート

バックアップの総コストを見積もるには、スケジュールを設定する必要があります。また、スケジュールを設定する前に月額コストの見積もりを取得できるよう、pricing calculator の更新にも取り組んでいます。コストを見積もるには、次の入力項目を指定する必要があります。

  • フルバックアップおよび増分バックアップのサイズ
  • 希望する実行頻度
  • 希望する保持期間
  • Cloud プロバイダーおよびリージョン
注記

サービス内のデータサイズが時間とともに増加するにつれて、バックアップの推定コストも変化することに注意してください。

バックアップを復元する

バックアップは、バックアップ元の既存サービスではなく、新しい ClickHouse Cloud サービスとして復元されます。

バックアップの Restore アイコンをクリックした後、作成される新しいサービスのサービス名を指定し、そのバックアップを復元できます:

ClickHouse Cloud でバックアップを復元する

新しいサービスは、準備が整うまでサービス一覧に Provisioning と表示されます:

サービスのプロビジョニングが進行中

復元されたサービスの扱い方

バックアップを復元すると、次の 2 つの類似したサービスが存在することになります。復元対象だった元のサービスと、その元のサービスのバックアップから復元された新しい復元済みサービスです。

バックアップからの復元が完了したら、次のいずれかを実施してください。

  • 新しい復元済みサービスを使用し、元のサービスを削除します。
  • 新しい復元済みサービスから元のサービスへデータを移行し、その後、新しい復元済みサービスを削除します。

新しく復元したサービスを使用する

新しく復元したサービスを使用するには、次の手順を実行します。

  1. 新しく復元したサービスに、ユースケースに必要な IP Access List のエントリが含まれていることを確認してください。
  2. 新しく復元したサービスに、必要なデータが含まれていることを確認してください。
  3. 元のサービスを削除してください。

新しく復元したサービスから元のサービスへデータを移行する

何らかの理由で新しく復元したサービスを利用できない場合、たとえば既存のサービスに接続しているユーザーやアプリケーションがまだ存在する場合などには、新しく復元したデータを元のサービスに移行することを検討するかもしれません。移行は次の手順で実行できます。

新しく復元したサービスへのリモートアクセスを許可する

新しいサービスは、元のサービスと同じ IP Allow List を使用してバックアップから復元されている必要があります。これは、Anywhere からのアクセスを許可していない限り、他の ClickHouse Cloud サービスへの接続は許可されないため必須です。Allow List を変更し、一時的に Anywhere からのアクセスを許可します。詳細は IP Access List ドキュメントを参照してください。

新しく復元した ClickHouse サービス上(復元されたデータをホストしているシステム)での作業

注記

新しいサービスへアクセスするには、そのパスワードをリセットする必要があります。サービス一覧の Settings タブから実行できます。

ソーステーブル(この例では db.table)を読み取れる読み取り専用ユーザーを追加します:

  CREATE USER exporter
  IDENTIFIED WITH SHA256_PASSWORD BY 'password-here'
  SETTINGS readonly = 1;
  GRANT SELECT ON db.table TO exporter;

テーブル定義をコピーする:

  SELECT create_table_query
  FROM system.tables
  WHERE database = 'db' AND table = 'table'

宛先の ClickHouse Cloud システム(テーブルが破損していた側)で:

宛先データベースを作成します:

  CREATE DATABASE db

ソース側の CREATE TABLE ステートメントを使用して、復元先のテーブルを作成します。

ヒント

CREATE ステートメントを実行する際は、ENGINE をパラメータなしの ReplicatedMergeTree に変更してください。ClickHouse Cloud はテーブルを常にレプリケートし、適切なパラメータを自動的に設定します。

  CREATE TABLE db.table ...
  ENGINE = ReplicatedMergeTree
  ORDER BY ...

remoteSecure 関数を使用して、新たに復元した ClickHouse Cloud サービスから元のサービスにデータを取り込みます:

  INSERT INTO db.table
  SELECT *
  FROM remoteSecure('source-hostname', db, table, 'exporter', 'password-here')

元のサービスへのデータ挿入が正常に完了したら、そのサービス内で必ずデータを検証してください。データの検証が済んだら、新しいサービスは削除してください。

テーブルの削除取り消し(Undelete / Undrop)

UNDROP コマンドは、Shared Catalog を通じて ClickHouse Cloud でサポートされています。

ユーザーが誤ってテーブルを削除してしまうのを防ぐには、GRANT を使用して、特定のユーザーまたはロールに対する DROP TABLE コマンド の権限を取り消すことができます。

注記

データの誤削除を防ぐため、デフォルトでは ClickHouse Cloud ではサイズが >1TB のテーブルは削除できないことに注意してください。 この閾値を超えるサイズのテーブルを削除したい場合は、設定項目 max_table_size_to_drop を使用することで削除できます。

DROP TABLE IF EXISTS table_to_drop
SYNC SETTINGS max_table_size_to_drop=2000000000000 -- increases the limit to 2TB
注記

レガシープラン: レガシープランをご利用のお客様は、デフォルトの 1 日 1 回のバックアップ(保持期間 24 時間)がストレージ料金に含まれます。

バックアップの所要時間

バックアップおよびリストアにかかる時間は、データベースのサイズに加えて、スキーマやテーブル数など、複数の要因に依存します。 増分バックアップは、バックアップ対象のデータ量が少ないため、通常フルバックアップよりもはるかに短時間で完了します。 増分バックアップからのリストアは、チェーン内のすべての増分バックアップと最後のフルバックアップがリストアに含まれるため、上記で説明したとおり、フルバックアップからのリストアよりもやや時間がかかります。

社内テストでは、約 1 TB 程度の小さなバックアップでは、バックアップに約 10〜15 分、またはそれ以上かかることが確認されています。 20 TB 未満のバックアップは 1 時間以内に完了するはずであり、50 TB のデータのバックアップには約 2〜3 時間かかる想定です。 バックアップはサイズが大きくなるほどスケールメリットが得られ、いくつかの社内サービスでは最大 1 PB のバックアップが約 10 時間で完了することを確認しています。

注記

外部バケットへのバックアップは、ClickHouse バケットへのバックアップよりも遅くなる場合があります。

リストアにかかる時間は、バックアップの所要時間とほぼ同程度です。

実際の所要時間は上記のような複数の要因に依存するため、ご自身のデータベースまたはサンプルデータでテストを行い、より正確な見積もりを取得することを推奨します。

設定可能なバックアップ

デフォルトとは異なるバックアップスケジュールを設定したい場合は、設定可能なバックアップを参照してください。

自分の Cloud アカウントにバックアップをエクスポートする

ご自身の Cloud アカウントにバックアップをエクスポートする場合は、こちらを参照してください。