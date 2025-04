分析器

在 ClickHouse 版本 24.3 中,新查询分析器默认启用。尽管修复了许多错误并引入了新的优化,但它也引入了一些 ClickHouse 行为的破坏性变化。请阅读以下更改,以确定如何重新编写查询以适应新的分析器。

之前的查询规划基础设施在查询验证步骤之前应用了 AST 级的优化。优化可以重写初始查询,使其变得有效并可以执行。

在新的分析器中,查询验证在优化步骤之前进行。这意味着之前可以执行的无效查询现在不再受支持。在这种情况下,查询必须手动修复。

示例 1:

以下查询在投影列表中使用 number 列,而在聚合后仅有 toString(number) 可用。在旧分析器中, GROUP BY toString(number) 被优化为 GROUP BY number ,从而使查询有效。

示例 2:

此查询中出现同样的问题:在使用其他键聚合后,使用了列 number 。之前的查询分析器通过将 HAVING 子句中的 number > 5 过滤器移动到 WHERE 子句来修复此查询。

为了修复查询,您应该将所有适用于非聚合列的条件移至 WHERE 部分,以符合标准 SQL 语法:

新的分析器始终执行类型检查。之前,可以使用无效的 SELECT 查询创建一个 VIEW 。然后,它将在第一次 SELECT 或 INSERT (在 MATERIALIZED VIEW 的情况下)时失败。

现在,不再可能创建这样的 VIEW 。

示例:

默认情况下, SELECT 列表中的别名不能用作 JOIN USING 键。

新的设置 analyzer_compatibility_join_using_top_level_identifier 启用时,会改变 JOIN USING 的行为,优先根据 SELECT 查询的投影列表中表达式解析标识符,而不是直接使用左表中的列。

示例:

当 analyzer_compatibility_join_using_top_level_identifier 设置为 true 时,连接条件被解释为 t1.a + 1 = t2.b ,与早期版本的行为一致。因此,结果将是 2, 'two' 。当设置为 false 时,连接条件默认变为 t1.b = t2.b ,查询将返回 2, 'one' 。如果 b 在 t1 中不存在,查询将失败并出现错误。

在新的分析器中,在涉及 ALIAS 或 MATERIALIZED 列的 JOIN USING 查询中使用 * 默认会将这些列包含在结果集中。

示例:

在新的分析器中,此查询的结果将包含来自两个表的 payload 列以及 id 。相比之下,之前的分析器仅在启用了特定设置( asterisk_include_alias_columns 或 asterisk_include_materialized_columns )时才会包含这些 ALIAS 列,且这些列可能会以不同的顺序出现。

为了确保一致且可预期的结果,特别是在将旧查询迁移到新分析器时,建议在 SELECT 子句中明确指定列,而不是使用 * 。

在新的分析器版本中,确定 USING 子句中指定的列的共同超类型的规则已标准化,以产生更可预测的结果,尤其在处理 LowCardinality 和 Nullable 等类型修饰符时。

LowCardinality(T) 和 T :当类型为 LowCardinality(T) 的列与类型为 T 的列连接时,结果共同超类型将为 T ,有效地丢弃 LowCardinality 修饰符。

Nullable(T) 和 T :当类型为 Nullable(T) 的列与类型为 T 的列连接时,结果共同超类型将为 Nullable(T) ,确保保留可空属性。

示例:

在此查询中, id 的共同超类型被确定为 String ,从 t1 中丢弃了 LowCardinality 修饰符。

在计算投影名称时,别名不会被替换。

在新的分析器中,类型推断发生在初始查询分析期间。此更改意味着在短路评估之前会进行类型检查;因此, if 函数参数必须始终具有共同超类型。

示例:

以下查询因 There is no supertype for types Array(UInt8), String because some of them are Array and some of them are not 而失败:

新的分析器显著改变了集群中服务器之间的通信协议。因此,无法在具有不同 enable_analyzer 设置值的服务器上运行分布式查询。

变更仍在使用旧分析器。这意味着某些新的 ClickHouse SQL 功能不能在变更中使用。例如, QUALIFY 子句。状态可以在 这里 检查。

新分析器目前不支持的功能列表: