メインコンテンツまでスキップ
メインコンテンツまでスキップ

EmbeddedRocksDBエンジン

Not supported in ClickHouse Cloud

このエンジンは、ClickHouseとRocksDBの統合を可能にします。

テーブルの作成

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) ENGINE = EmbeddedRocksDB([ttl, rocksdb_dir, read_only]) PRIMARY KEY(primary_key_name)
[ SETTINGS name=value, ... ]

エンジンパラメータ:

  • ttl - 値の有効期限。TTLは秒単位で受け付けられます。TTLが0の場合、通常のRocksDBインスタンスが使用されます(TTLなし)。
  • rocksdb_dir - 既存のRocksDBのディレクトリのパスまたは作成されたRocksDBの宛先パス。指定されたrocksdb_dirでテーブルを開きます。
  • read_only - read_onlyがtrueに設定されている場合、読み取り専用モードが使用されます。TTLを持つストレージでは、コンパクションはトリガーされず(手動でも自動でも)、期限切れのエントリは削除されません。
  • primary_key_name – カラムリストの任意のカラム名。
  • primary key は指定する必要があり、主キーには1つのカラムのみがサポートされます。主キーはrocksdb keyとしてバイナリにシリアライズされます。
  • 主キー以外のカラムは、対応する順序でrocksdb値としてバイナリにシリアライズされます。
  • equalsまたはinフィルタリングを持つクエリは、rocksdbからのマルチキー探索に最適化されます。

エンジン設定:

  • optimize_for_bulk_insert – テーブルはバルク挿入に最適化されています(挿入パイプラインは、メモリテーブルに書き込むのではなく、SSTファイルを作成し、rocksdbデータベースにインポートします);デフォルト値:1
  • bulk_insert_block_size - バルク挿入によって作成されるSSTファイルの最小サイズ(行の観点から);デフォルト値:1048449

例:

CREATE TABLE test
(
    `key` String,
    `v1` UInt32,
    `v2` String,
    `v3` Float32
)
ENGINE = EmbeddedRocksDB
PRIMARY KEY key

メトリクス

system.rocksdbテーブルもあり、rocksdbの統計情報を表示します:

SELECT
    name,
    value
FROM system.rocksdb

┌─name──────────────────────┬─value─┐
│ no.file.opens             │     1 │
│ number.block.decompressed │     1 │
└───────────────────────────┴───────┘

構成

次のようにconfigを使用して任意のrocksdbオプションを変更できます:

<rocksdb>
    <options>
        <max_background_jobs>8</max_background_jobs>
    </options>
    <column_family_options>
        <num_levels>2</num_levels>
    </column_family_options>
    <tables>
        <table>
            <name>TABLE</name>
            <options>
                <max_background_jobs>8</max_background_jobs>
            </options>
            <column_family_options>
                <num_levels>2</num_levels>
            </column_family_options>
        </table>
    </tables>
</rocksdb>

デフォルトでは、トリビアル近似カウント最適化はオフになっており、これがcount()クエリのパフォーマンスに影響を与える可能性があります。この 最適化を有効にするには、optimize_trivial_approximate_count_query = 1を設定します。この設定はEmbeddedRocksDBエンジンのsystem.tablesにも影響を与え、 total_rowsおよびtotal_bytesの近似値を表示するには設定をオンにします。

サポートされている操作

挿入

新しい行がEmbeddedRocksDBに挿入されるとき、キーがすでに存在する場合は値が更新され、存在しない場合は新しいキーが作成されます。

例:

INSERT INTO test VALUES ('some key', 1, 'value', 3.2);

削除

行はDELETEクエリまたはTRUNCATEを使用して削除できます。

DELETE FROM test WHERE key LIKE 'some%' AND v1 > 1;
ALTER TABLE test DELETE WHERE key LIKE 'some%' AND v1 > 1;
TRUNCATE TABLE test;

更新

値はALTER TABLEクエリを使用して更新できます。主キーは更新できません。

ALTER TABLE test UPDATE v1 = v1 * 10 + 2 WHERE key LIKE 'some%' AND v3 > 3.1;

ジョイン

EmbeddedRocksDBテーブルとの特別なdirectジョインがサポートされています。 この直接ジョインはメモリ内でハッシュテーブルを形成せず、EmbeddedRocksDBからデータに直接アクセスします。

大きなジョインでは、ハッシュテーブルが作成されないため、直接ジョインでメモリ使用量が大幅に低下することがあります。

直接ジョインを有効にするには:

SET join_algorithm = 'direct, hash'
ヒント

join_algorithmdirect, hashに設定されると、可能な場合に直接ジョインが使用され、そうでなければハッシュが使用されます。

EmbeddedRocksDBテーブルの作成とデータの追加
CREATE TABLE rdb
(
    `key` UInt32,
    `value` Array(UInt32),
    `value2` String
)
ENGINE = EmbeddedRocksDB
PRIMARY KEY key
INSERT INTO rdb
    SELECT
        toUInt32(sipHash64(number) % 10) AS key,
        [key, key+1] AS value,
        ('val2' || toString(key)) AS value2
    FROM numbers_mt(10);
rdbテーブルとジョインするためのテーブルの作成とデータの追加
CREATE TABLE t2
(
    `k` UInt16
)
ENGINE = TinyLog
INSERT INTO t2 SELECT number AS k
FROM numbers_mt(10)
ジョインアルゴリズムをdirectに設定
SET join_algorithm = 'direct'
INNER JOIN
SELECT *
FROM
(
    SELECT k AS key
    FROM t2
) AS t2
INNER JOIN rdb ON rdb.key = t2.key
ORDER BY key ASC
┌─key─┬─rdb.key─┬─value──┬─value2─┐
│   0 │       0 │ [0,1]  │ val20  │
│   2 │       2 │ [2,3]  │ val22  │
│   3 │       3 │ [3,4]  │ val23  │
│   6 │       6 │ [6,7]  │ val26  │
│   7 │       7 │ [7,8]  │ val27  │
│   8 │       8 │ [8,9]  │ val28  │
│   9 │       9 │ [9,10] │ val29  │
└─────┴─────────┴────────┴────────┘

ジョインに関する詳細情報