跳到主要内容
跳到主要内容

MergeTree 引擎家族

来自 MergeTree 家族的表引擎是 ClickHouse 数据存储能力的核心。它们提供了大多数恢复能力和高性能数据检索的特性:列式存储、自定义分区、稀疏主键索引、次级数据跳过索引等。

基础 MergeTree 表引擎可以被视为单节点 ClickHouse 实例的默认表引擎,因为它在广泛的用例中都是多功能且实用的。

对于生产使用,ReplicatedMergeTree 是最佳选择,因为它为常规 MergeTree 引擎的所有功能增加了高可用性。一个额外的好处是在数据摄取时自动进行数据去重,因此如果在插入过程中发生网络问题,软件可以安全地重试。

MergeTree 家族的其他引擎为一些特定用例增加了额外的功能。通常,这些功能以后台进行的额外数据处理实现。

MergeTree 引擎的主要缺点是它们相对较重。因此,典型的模式是使用数量不多的引擎。如果你需要许多小表,例如用于临时数据,可以考虑 Log 引擎家族

页面描述
MergeTreeMergeTree-家族表引擎设计用于高数据摄取速率和大数据量。
数据复制ClickHouse 中的数据复制概述
自定义分区键了解如何向 MergeTree 表添加自定义分区键。
ReplacingMergeTree与 MergeTree 不同,它通过移除具有相同排序键值的重复条目来工作(ORDER BY 表部分,而不是 PRIMARY KEY)。
CoalescingMergeTreeCoalescingMergeTree 继承自 MergeTree 引擎。其关键特性是在分片合并期间能够自动存储每列的最后一个非空值。
SummingMergeTreeSummingMergeTree 继承自 MergeTree 引擎。其关键特性是在分片合并期间能够自动对数值数据进行求和。
AggregatingMergeTree用具有相同主键的单行(在单个数据分片内)替换所有行(更准确地说,是具有相同 排序键),并存储聚合函数的状态组合。
CollapsingMergeTree继承自 MergeTree,但在合并过程中增加了合并行的逻辑。
VersionedCollapsingMergeTree允许快速写入不断变化的对象状态,并在后台删除旧对象状态。
GraphiteMergeTree设计用于厚度处理和聚合/平均(汇总)Graphite 数据。
精确与近似向量搜索精确与近似向量搜索的文档
使用文本索引进行全文搜索快速查找文本中的搜索词。