メインコンテンツまでスキップ
メインコンテンツまでスキップ

clickhouse_backupview

Pythonモジュールで、BACKUPコマンドによって作成されたバックアップの分析を助けます。主な目的は、バックアップを実際に復元することなく、バックアップから情報を取得できるようにすることです。

このモジュールは以下の機能を提供します:

  • バックアップに含まれるファイルの列挙
  • バックアップからのファイルの読み取り
  • バックアップに含まれるデータベース、テーブル、パーツに関する有用な情報を読みやすい形式で取得
  • バックアップの整合性のチェック

例:

from clickhouse_backupview import open_backup, S3, FileInfo


# バックアップを開きます。ローカルパスを使うこともできます:

# backup = open_backup("/backups/my_backup_1/")
backup = open_backup(S3("uri", "access_key_id", "secret_access_key"))


# バックアップ内のデータベースのリストを取得します。
print(backup.get_databases())


# バックアップ内のテーブルのリストを取得し、

# 各テーブルの作成クエリとパーツおよびパーティションのリストを取得します。
for db in backup.get_databases():
    for tbl in backup.get_tables(database=db):
        print(backup.get_create_query(database=db, table=tbl))
        print(backup.get_partitions(database=db, table=tbl))
        print(backup.get_parts(database=db, table=tbl))


# バックアップからすべてを抽出します。
backup.extract_all(table="mydb.mytable", out='/tmp/my_backup_1/all/')


# 特定のテーブルのデータを抽出します。
backup.extract_table_data(table="mydb.mytable", out='/tmp/my_backup_1/mytable/')


# 単一のパーティションを抽出します。
backup.extract_table_data(table="mydb.mytable", partition="202201", out='/tmp/my_backup_1/202201/')


# 単一のパーツを抽出します。
backup.extract_table_data(table="mydb.mytable", part="202201_100_200_3", out='/tmp/my_backup_1/202201_100_200_3/')

さらなる例については、テストをご覧ください。