跳到主要内容
跳到主要内容

MergeTree 引擎家族

来自 MergeTree 家族的表引擎是 ClickHouse 数据存储能力的核心。它们提供了大多数用于弹性和高性能数据检索的特性:列式存储、自定义分区、稀疏主键、二级数据跳过索引等。

基础 MergeTree 表引擎可以被视为单节点 ClickHouse 实例的默认表引擎,因为它在广泛的用例中既多功能又实用。

对于生产使用,ReplicatedMergeTree 是首选,因为它为常规 MergeTree 引擎的所有功能增加了高可用性。一个附加的好处是在数据摄取时自动进行数据去重,因此,如果在插入期间发生网络问题,软件可以安全地重试。

MergeTree 家族的其他引擎为某些特定用例增加了额外的功能。通常,这些功能是在后台实现的额外数据操作。

MergeTree 引擎的主要缺点是它们相对重。因此,典型的模式是不会有太多这样的引擎。如果您需要许多小表,例如用于临时数据,考虑 Log 引擎家族

页面描述
VersionedCollapsingMergeTree允许快速写入持续变化的对象状态,并在后台删除旧对象状态。
Data ReplicationClickHouse 数据复制的概述
MergeTreeMergeTree 家族表引擎旨在处理高数据摄取速率和海量数据。
Approximate Nearest Neighbor Search with Vector Similarity Indexes使用向量相似性索引的近似最近邻搜索
CollapsingMergeTree继承自 MergeTree,但在合并过程中添加了合并行的逻辑。
Custom Partitioning Key学习如何向 MergeTree 表添加自定义分区键。
Full-text Search using Full-text Indexes快速查找文本中的搜索词。
SummingMergeTreeSummingMergeTree 继承自 MergeTree 引擎。其关键特性是在分区合并期间自动汇总数字数据的能力。
AggregatingMergeTree用具有相同主键(或更准确地说,具有相同 排序键)的所有行替换为单行(在单个数据部分内),该行存储聚合函数状态的组合。
GraphiteMergeTree设计用于稀疏和聚合/平均(汇总)Graphite 数据。
ReplacingMergeTree与 MergeTree 的不同之处在于,它移除具有相同排序键值(ORDER BY 表部分,而不是 PRIMARY KEY)的重复条目。