EmbeddedRocksDB 引擎
Not supported in ClickHouse Cloud
该引擎允许将 ClickHouse 与 RocksDB 集成。
创建表
引擎参数:
ttl
- 值的生存时间。TTL 以秒为单位。如果 TTL 是 0,则使用常规的 RocksDB 实例(无 TTL)。rocksdb_dir
- 已存在的 RocksDB 的目录路径或创建的 RocksDB 的目标路径。使用指定的rocksdb_dir
打开表。read_only
- 当read_only
设置为 true 时,将使用只读模式。对于具有 TTL 的存储,压缩不会被触发(无论是手动还是自动),因此没有过期项会被删除。primary_key_name
– 列表中的任何列名称。- 必须指定
primary key
,它仅支持一个列作为主键。主键将被序列化为二进制的rocksdb key
。 - 除主键外的列将按相应顺序序列化成二进制的
rocksdb
值。 - 使用
equals
或in
过滤的查询将被优化为从rocksdb
查询多个键。
引擎设置:
optimize_for_bulk_insert
– 表被优化用于批量插入(插入管道将创建 SST 文件并导入到 rocksdb 数据库,而不是写入内存表);默认值:1
。bulk_insert_block_size
- 批量插入时创建的 SST 文件的最小大小(以行数为单位);默认值:1048449
。
示例:
监控指标
还有 system.rocksdb
表,展示 rocksdb 统计信息:
配置
您还可以使用配置更改任何 rocksdb 选项:
默认情况下,简单近似计数优化是关闭的,这可能会影响 count()
查询的性能。要启用此优化,请设置 optimize_trivial_approximate_count_query = 1
。此外,此设置会影响 EmbeddedRocksDB 引擎的 system.tables
,启用该设置以查看 total_rows
和 total_bytes
的近似值。
支持的操作
插入操作
当新行插入到 EmbeddedRocksDB
中时,如果键已存在,则值将被更新,否则将创建一个新键。
示例:
删除操作
可以使用 DELETE
查询或 TRUNCATE
删除行。
更新操作
可以使用 ALTER TABLE
查询更新值。主键不能被更新。
连接操作
支持与 EmbeddedRocksDB 表的特殊 direct
连接。
此直接连接避免在内存中形成哈希表,并直接从 EmbeddedRocksDB 访问数据。
在大连接的情况下,您可能会发现使用直接连接的内存使用量大大减少,因为不存在哈希表的创建。
要启用直接连接:
提示
当 join_algorithm
设置为 direct, hash
时,将优先使用直接连接,如果不可能,则使用哈希连接。