Merge Table Engine
Merge
エンジン(MergeTree
と混同しないでください)は、データを自身で保存することはありませんが、他の任意の数のテーブルから同時に読み取ることを可能にします。
読み取りは自動的に並列化されます。テーブルへの書き込みはサポートされていません。読み取る際には、実際に読み取られているテーブルのインデックスが使用されます(存在する場合)。
テーブルの作成
エンジンパラメータ
db_name
db_name
— 可能な値:
- データベース名、
- データベース名を返す定数式、例えば、
currentDatabase()
、 REGEXP(expression)
、ここでexpression
はDB名に一致する正規表現です。
tables_regexp
tables_regexp
— 指定されたDBまたはDBs内のテーブル名に一致する正規表現。
正規表現 — re2(PCREのサブセットをサポート)、大文字と小文字を区別します。 正規表現のシンボルのエスケープに関する注意点は、「一致」セクションを参照してください。
table_to_write
table_to_write
- Merge
テーブルへの挿入時に書き込むテーブル名。
可能な値:
'db_name.table_name'
- 特定のデータベースの特定のテーブルに挿入します。'table_name'
- テーブルdb_name.table_name
に挿入します。最初のパラメータdb_name
が正規表現でない場合のみ許可されます。auto
- 辞書順でtables_regexp
に渡された最後のテーブルに挿入します。最初のパラメータdb_name
が正規表現でない場合のみ許可されます。
使用法
読み取るテーブルを選択する際に、Merge
テーブル自体は選択されません。これはループを避けるためです。
互いのデータを無限に読み取ろうとする2つのMerge
テーブルを作成することは可能ですが、良いアイデアではありません。
Merge
エンジンの典型的な使用方法は、多数のTinyLog
テーブルを単一のテーブルとして操作することです。
例
例 1
2つのデータベース ABC_corporate_site
と ABC_store
を考えます。all_visitors
テーブルは、両方のデータベースのvisitors
テーブルからIDを含みます。
例 2
古いテーブルWatchLog_old
があり、データを新しいテーブルWatchLog_new
に移動することなくパーティショニングを変更することにしたとしましょう。そして、両方のテーブルのデータを確認する必要があります。
テーブルWatchLog
への挿入はテーブルWatchLog_new
に行われます。
仮想カラム
-
_table
— データが読み取られたテーブルの名前を含みます。型: String。WHERE/PREWHERE
節で_table
に定数条件を設定できます(例えば、WHERE _table='xyz'
)。この場合、読み取り操作は条件を満たすテーブルに対してのみ行われるため、_table
カラムはインデックスとして機能します。
参照先