跳到主要内容
跳到主要内容

条件函数

概述

直接使用条件表达式结果

条件表达式始终返回 01NULL。因此,你可以直接使用条件表达式的结果,例如:

SELECT left < right AS is_small
FROM LEFT_RIGHT

┌─is_small─┐
│     ᴺᵁᴸᴸ │
│        1 │
│        0 │
│        0 │
│     ᴺᵁᴸᴸ │
└──────────┘

条件表达式中的 NULL 值

当条件表达式中涉及 NULL 值时,结果也将为 NULL

SELECT
    NULL < 1,
    2 < NULL,
    NULL < NULL,
    NULL = NULL

┌─less(NULL, 1)─┬─less(2, NULL)─┬─less(NULL, NULL)─┬─equals(NULL, NULL)─┐
│ ᴺᵁᴸᴸ          │ ᴺᵁᴸᴸ          │ ᴺᵁᴸᴸ             │ ᴺᵁᴸᴸ               │
└───────────────┴───────────────┴──────────────────┴────────────────────┘

因此,当类型为 Nullable 时,你应当格外谨慎地构造查询。

下面的示例通过未能为 multiIf 添加等值条件而导致失败,从而演示了这一点。

SELECT
    left,
    right,
    multiIf(left < right, 'left 更小', left > right, 'right 更小', '两者相等') AS faulty_result
FROM LEFT_RIGHT

┌─left─┬─right─┬─faulty_result────┐
│ ᴺᵁᴸᴸ │     4 │ 两者相等       │
│    1 │     3 │ left 更小  │
│    2 │     2 │ 两者相等       │
│    3 │     1 │ right 更小 │
│    4 │  ᴺᵁᴸᴸ │ 两者相等       │
└──────┴───────┴──────────────────┘

CASE 语句

ClickHouse 中的 CASE 表达式提供了与 SQL CASE 运算符类似的条件逻辑。它会对条件进行求值,并根据第一个满足的条件返回相应的值。

ClickHouse 支持两种形式的 CASE:

  1. CASE WHEN ... THEN ... ELSE ... END
    这种形式提供了充分的灵活性,并在内部通过 multiIf 函数实现。每个条件都会被独立求值,表达式中可以包含非常量值。
SELECT
    number,
    CASE
        WHEN number % 2 = 0 THEN number + 1
        WHEN number % 2 = 1 THEN number * 10
        ELSE number
    END AS result
FROM system.numbers
WHERE number < 5;

-- 转换为
SELECT
    number,
    multiIf((number % 2) = 0, number + 1, (number % 2) = 1, number * 10, number) AS result
FROM system.numbers
WHERE number < 5

┌─number─┬─result─┐
│      0 │      1 │
│      1 │     10 │
│      2 │      3 │
│      3 │     30 │
│      4 │      5 │
└────────┴────────┘

返回 5 行。用时:0.002 秒。
  1. CASE <expr> WHEN <val1> THEN ... WHEN <val2> THEN ... ELSE ... END
    这种更紧凑的形式针对常量值匹配进行了优化,并在内部使用 caseWithExpression()

例如,下面的写法是有效的:

SELECT
    number,
    CASE number
        WHEN 0 THEN 100
        WHEN 1 THEN 200
        ELSE 0
    END AS result
FROM system.numbers
WHERE number < 3;

-- 转换为

SELECT
    number,
    caseWithExpression(number, 0, 100, 1, 200, 0) AS result
FROM system.numbers
WHERE number < 3

┌─number─┬─result─┐ │ 0 │ 100 │ │ 1 │ 200 │ │ 2 │ 0 │ └────────┴────────┘

3 行结果,耗时:0.002 秒。


此形式同样不要求返回表达式必须为常量。

```sql
SELECT
    number,
    CASE number
        WHEN 0 THEN number + 1
        WHEN 1 THEN number * 10
        ELSE number
    END
FROM system.numbers
WHERE number < 3;

-- 转换为

SELECT
    number,
    caseWithExpression(number, 0, number + 1, 1, number * 10, number)
FROM system.numbers
WHERE number < 3

┌─number─┬─caseWithExpr⋯0), number)─┐
│      0 │                        1 │
│      1 │                       10 │
│      2 │                        2 │
└────────┴──────────────────────────┘

返回 3 行。用时:0.001 秒。

注意事项

ClickHouse 会在评估任何条件之前,先确定 CASE 表达式(或其内部等价形式,例如 multiIf)的结果类型。当各分支返回的表达式类型不同(例如不同时区或不同数值类型)时,这一点尤为重要。

  • 结果类型会基于所有分支中“最大”的兼容类型来选择。
  • 一旦选定了该类型,其他所有分支都会被隐式转换为此类型——即使这些分支在运行时逻辑上永远不会被执行。
  • 对于像 DateTime64 这类将时区作为类型签名一部分的类型,这会导致一些出乎意料的行为:第一个遇到的时区可能会被用于所有分支,即便其他分支指定了不同的时区。

例如,在下面的示例中,所有行都会以第一个匹配分支的时区返回时间戳,即 Asia/Kolkata

SELECT
    number,
    CASE
        WHEN number = 0 THEN fromUnixTimestamp64Milli(0, 'Asia/Kolkata')
        WHEN number = 1 THEN fromUnixTimestamp64Milli(0, 'America/Los_Angeles')
        ELSE fromUnixTimestamp64Milli(0, 'UTC')
    END AS tz
FROM system.numbers
WHERE number < 3;

-- 转换为

SELECT
    number,
    multiIf(number = 0, fromUnixTimestamp64Milli(0, 'Asia/Kolkata'), number = 1, fromUnixTimestamp64Milli(0, 'America/Los_Angeles'), fromUnixTimestamp64Milli(0, 'UTC')) AS tz
FROM system.numbers
WHERE number < 3

┌─number─┬──────────────────────tz─┐
│      0 │ 1970-01-01 05:30:00.000 │
│      1 │ 1970-01-01 05:30:00.000 │
│      2 │ 1970-01-01 05:30:00.000 │
└────────┴─────────────────────────┘

返回 3 行。用时:0.011 秒。

在这里,ClickHouse 遇到了多个 DateTime64(3, &lt;timezone&gt;) 返回类型。它将首先遇到的 DateTime64(3, 'Asia/Kolkata' 推断为通用类型,并将其他分支隐式转换为该类型。

可以通过先转换为字符串来解决这一问题,从而保留预期的时区格式:

SELECT
    number,
    multiIf(
        number = 0, formatDateTime(fromUnixTimestamp64Milli(0), '%F %T', 'Asia/Kolkata'),
        number = 1, formatDateTime(fromUnixTimestamp64Milli(0), '%F %T', 'America/Los_Angeles'),
        formatDateTime(fromUnixTimestamp64Milli(0), '%F %T', 'UTC')
    ) AS tz
FROM system.numbers
WHERE number < 3;

-- is translated to

SELECT
    number,
    multiIf(number = 0, formatDateTime(fromUnixTimestamp64Milli(0), '%F %T', 'Asia/Kolkata'), number = 1, formatDateTime(fromUnixTimestamp64Milli(0), '%F %T', 'America/Los_Angeles'), formatDateTime(fromUnixTimestamp64Milli(0), '%F %T', 'UTC')) AS tz
FROM system.numbers
WHERE number < 3

┌─number─┬─tz──────────────────┐ │ 0 │ 1970-01-01 05:30:00 │ │ 1 │ 1969-12-31 16:00:00 │ │ 2 │ 1970-01-01 00:00:00 │ └────────┴─────────────────────┘

3 行结果,耗时 0.002 秒。


<!-- 
以下标签内的内容将在文档框架构建时被替换为
从 system.functions 生成的文档。请勿修改或删除这些标签。
参见:https://github.com/ClickHouse/clickhouse-docs/blob/main/contribute/autogenerated-documentation-from-source.md
-->

clamp

引入于:v24.5

将一个值限制在指定的最小值和最大值范围之内。

如果该值小于最小值,则返回最小值;如果该值大于最大值,则返回最大值;否则,返回该值本身。

所有参数必须是可相互比较的类型。结果类型为所有参数中兼容类型里范围最大的类型。

语法

clamp(value, min, max)

参数

  • value — 要进行限制的值。 - min — 最小边界。 - max — 最大边界。

返回值

返回限制在 [min, max] 范围内的值。

示例

基本用法

SELECT clamp(5, 1, 10) AS result;
┌─result─┐
│      5 │
└────────┘

数值低于最小值

SELECT clamp(-3, 0, 7) AS result;
┌─result─┐
│      0 │
└────────┘

值超过最大值

SELECT clamp(15, 0, 7) AS result;
┌─result─┐
│      7 │
└────────┘

greatest

引入于:v1.1

返回参数中最大的值。 会忽略 NULL 参数。

  • 对于数组,返回按字典序比较中最大的数组。
  • 对于 DateTime 类型,结果类型会提升为参与比较的最大类型(例如,与 DateTime32 混用时会提升为 DateTime64)。
注意
使用设置项 least_greatest_legacy_null_behavior 更改 NULL 行为

版本 24.12 引入了一个向后不兼容的变更:NULL 值会被忽略,而之前当任一参数为 NULL 时会返回 NULL。 若要保留之前的行为,请将设置项 least_greatest_legacy_null_behavior(默认:false)设为 true

语法

greatest(x1[, x2, ...])

参数

  • x1[, x2, ...] — 要比较的一个或多个值。所有参数必须是彼此可比较的类型。Any

返回值

返回参数中最大的值,并自动提升为最大兼容类型。Any

示例

数值类型

SELECT greatest(1, 2, toUInt8(3), 3.) AS result, toTypeName(result) AS type;
-- 返回的类型为 Float64,因为 UInt8 必须提升至 64 位以进行比较。
┌─result─┬─type────┐
│      3 │ Float64 │
└────────┴─────────┘

数组

SELECT greatest(['hello'], ['there'], ['world']);
┌─greatest(['hello'], ['there'], ['world'])─┐
│ ['world']                                 │
└───────────────────────────────────────────┘

DateTime 类型

SELECT greatest(toDateTime32(now() + toIntervalDay(1)), toDateTime64(now(), 3));
-- 返回类型为 DateTime64,因为 DateTime32 必须提升至 64 位以进行比较。
┌─greatest(toD⋯(now(), 3))─┐
│  2025-05-28 15:50:53.000 │
└──────────────────────────┘

if

引入版本:v1.1

执行条件分支。

  • 如果条件 cond 的计算结果为非零值,函数返回表达式 then 的结果。
  • 如果 cond 的计算结果为零或 NULL,则返回 else 表达式的结果。

设置项 short_circuit_function_evaluation 用于控制是否启用短路求值。

如果启用,只有在 cond 为 true 的行上才会计算 then 表达式,在 cond 为 false 的行上才会计算 else 表达式。

例如,在启用短路求值的情况下,执行以下查询时不会抛出除零异常:

SELECT if(number = 0, 0, intDiv(42, number)) FROM numbers(10)

thenelse 必须为相同或兼容的类型。

语法

if(cond, then, else)

参数

  • cond — 要计算的条件。UInt8Nullable(UInt8)NULL
  • then — 当 cond 为 true 时返回的表达式。
  • else — 当 cond 为 false 或 NULL 时返回的表达式。

返回值

根据条件 cond,返回 thenelse 表达式的结果。

示例

示例用法

SELECT if(1, 2 + 2, 2 + 6) AS res;
┌─res─┐
│   4 │
└─────┘

least

引入于:v1.1

返回参数中最小的值。 NULL 参数会被忽略。

  • 对于数组,返回按字典序最小的数组。
  • 对于 DateTime 类型,结果类型会提升为最大的类型(例如,与 DateTime32 混合时为 DateTime64)。
注意
使用设置项 least_greatest_legacy_null_behavior 来更改 NULL 行为

版本 24.12 引入了一个向后不兼容的变更:现在会忽略 NULL 值,而之前只要任一参数为 NULL 就返回 NULL。 若要保留之前的行为,请将设置项 least_greatest_legacy_null_behavior(默认值:false)设为 true

语法

least(x1[, x2, ...])

参数

  • x1[, x2, ...] — 要比较的一个或多个值。所有参数必须为可相互比较的类型。Any

返回值

返回参数中最小的值,并提升到最高的兼容类型。Any

示例

数值类型

SELECT least(1, 2, toUInt8(3), 3.) AS result, toTypeName(result) AS type;
-- 返回类型为 Float64,因为 UInt8 必须提升至 64 位以进行比较。
┌─result─┬─type────┐
│      1 │ Float64 │
└────────┴─────────┘

数组

SELECT least(['hello'], ['there'], ['world']);
┌─least(['hell⋯ ['world'])─┐
│ ['hello']                │
└──────────────────────────┘

DateTime 类型

SELECT least(toDateTime32(now() + toIntervalDay(1)), toDateTime64(now(), 3));
-- 返回类型为 DateTime64,因为 DateTime32 必须提升至 64 位以进行比较。
┌─least(toDate⋯(now(), 3))─┐
│  2025-05-27 15:55:20.000 │
└──────────────────────────┘

multiIf

引入版本:v1.1

允许在查询中以更简洁的方式编写 CASE 运算符。 按顺序依次计算每个条件。对于第一个为真(非零且非 NULL)的条件,返回对应分支的值。 如果所有条件都不为真,则返回 else 值。

short_circuit_function_evaluation 设置控制 是否启用短路求值。如果启用,则 then_i 表达式只会在满足 ((NOT cond_1) AND ... AND (NOT cond_{i-1}) AND cond_i) 为真的行上进行计算。

例如,在启用短路求值的情况下,执行以下查询时不会抛出除零异常:

SELECT multiIf(number = 2, intDiv(1, number), number = 5) FROM numbers(10)

所有分支表达式和 else 表达式必须具有相同的公共超类型。NULL 条件视为 false

语法

multiIf(cond_1, then_1, cond_2, then_2, ..., else)

别名: caseWithoutExpression, caseWithoutExpr

参数

  • cond_N — 第 N 个被求值的条件,用于控制是否返回 then_N。类型为 UInt8Nullable(UInt8)NULL
  • then_N — 当 cond_N 为真时的函数结果。- else — 当所有条件都不为真时的函数结果。

返回值

对于匹配的 cond_N,返回对应的 then_N 结果,否则返回 else 的结果。

示例

用法示例

CREATE TABLE LEFT_RIGHT (left Nullable(UInt8), right Nullable(UInt8)) ENGINE = Memory;
INSERT INTO LEFT_RIGHT VALUES (NULL, 4), (1, 3), (2, 2), (3, 1), (4, NULL);

SELECT
    left,
    right,
    multiIf(left < right, 'left 较小', left > right, 'left 较大', left = right, '两者相等', '空值') AS result
FROM LEFT_RIGHT;
┌─left─┬─right─┬─result──────────┐
│ ᴺᵁᴸᴸ │     4 │ 空值            │
│    1 │     3 │ 左值较小        │
│    2 │     2 │ 两者相等        │
│    3 │     1 │ 左值较大        │
│    4 │  ᴺᵁᴸᴸ │ 空值            │
└──────┴───────┴─────────────────┘