LIMIT n BY expressions 句を含むクエリは、expressions のそれぞれ異なる値ごとに先頭の n 行を選択します。LIMIT BY のキーには任意個数の expressions を含めることができます。
ClickHouse は次の構文のバリエーションをサポートしています:
LIMIT [offset_value, ]n BY expressions
LIMIT n OFFSET offset_value BY expressions
クエリ処理中、ClickHouse はソートキーで並べ替えられた順にデータを処理します。ソートキーは ORDER BY 句を使用して明示的に設定するか、テーブルエンジンのプロパティとして暗黙的に設定されます(行の順序が保証されるのは ORDER BY を使用する場合のみであり、そうでない場合はマルチスレッド動作により行ブロックの順序は保証されません)。その後、ClickHouse は LIMIT n BY expressions を適用し、expressions の異なる組み合わせごとに先頭の n 行を返します。OFFSET が指定されている場合、expressions のそれぞれの異なる組み合わせに属する各データブロックについて、ClickHouse はブロックの先頭から offset_value 行をスキップし、結果として最大 n 行を返します。offset_value がデータブロック内の行数より大きい場合、ClickHouse はそのブロックから 0 行を返します。
注記
LIMIT BY は LIMIT とは関係がありません。両方を同じクエリ内で使用できます。
LIMIT BY 句で列名の代わりに列番号を使用したい場合は、設定 enable_positional_arguments を有効にします。
サンプルテーブル:
CREATE TABLE limit_by(id Int, val Int) ENGINE = Memory;
INSERT INTO limit_by VALUES (1, 10), (1, 11), (1, 12), (2, 20), (2, 21);
クエリ:
SELECT * FROM limit_by ORDER BY id, val LIMIT 2 BY id
┌─id─┬─val─┐
│ 1 │ 10 │
│ 1 │ 11 │
│ 2 │ 20 │
│ 2 │ 21 │
└────┴─────┘
SELECT * FROM limit_by ORDER BY id, val LIMIT 1, 2 BY id
┌─id─┬─val─┐
│ 1 │ 11 │
│ 1 │ 12 │
│ 2 │ 21 │
└────┴─────┘
SELECT * FROM limit_by ORDER BY id, val LIMIT 2 OFFSET 1 BY id クエリは同じ結果を返します。
次のクエリは、全体で最大 100 行まで(LIMIT n BY + LIMIT)という制約付きで、各 domain, device_type の組み合わせごとに上位 5 件のリファラを返します。
SELECT
domainWithoutWWW(URL) AS domain,
domainWithoutWWW(REFERRER_URL) AS referrer,
device_type,
count() cnt
FROM hits
GROUP BY domain, referrer, device_type
ORDER BY cnt DESC
LIMIT 5 BY domain, device_type
LIMIT 100
LIMIT BY ALL
LIMIT BY ALL は、集約関数ではないすべての SELECT で指定された式を列挙するのと同等です。
例えば:
SELECT col1, col2, col3 FROM table LIMIT 2 BY ALL
と同じです
SELECT col1, col2, col3 FROM table LIMIT 2 BY col1, col2, col3
特別なケースとして、引数に集約関数とその他のフィールドが両方含まれる関数がある場合、LIMIT BY キーには、その関数から抽出可能な非集約フィールドが可能な限り多く含まれます。
例えば:
SELECT substring(a, 4, 2), substring(substring(a, 1, 2), 1, count(b)) FROM t LIMIT 2 BY ALL
と同じです
SELECT substring(a, 4, 2), substring(substring(a, 1, 2), 1, count(b)) FROM t LIMIT 2 BY substring(a, 4, 2), substring(a, 1, 2)
サンプルテーブル:
CREATE TABLE limit_by(id Int, val Int) ENGINE = Memory;
INSERT INTO limit_by VALUES (1, 10), (1, 11), (1, 12), (2, 20), (2, 21);
クエリ:
SELECT * FROM limit_by ORDER BY id, val LIMIT 2 BY id
┌─id─┬─val─┐
│ 1 │ 10 │
│ 1 │ 11 │
│ 2 │ 20 │
│ 2 │ 21 │
└────┴─────┘
SELECT * FROM limit_by ORDER BY id, val LIMIT 1, 2 BY id
┌─id─┬─val─┐
│ 1 │ 11 │
│ 1 │ 12 │
│ 2 │ 21 │
└────┴─────┘
SELECT * FROM limit_by ORDER BY id, val LIMIT 2 OFFSET 1 BY id クエリは同じ結果を返します。
LIMIT BY ALL の使用:
SELECT id, val FROM limit_by ORDER BY id, val LIMIT 2 BY ALL
これは次の内容と同等です:
SELECT id, val FROM limit_by ORDER BY id, val LIMIT 2 BY id, val
次のクエリは、domain, device_type の各組み合わせについて上位 5 件のリファラを返し、結果全体を最大 100 行に制限します(LIMIT n BY + LIMIT)。
SELECT
domainWithoutWWW(URL) AS domain,
domainWithoutWWW(REFERRER_URL) AS referrer,
device_type,
count() cnt
FROM hits
GROUP BY domain, referrer, device_type
ORDER BY cnt DESC
LIMIT 5 BY domain, device_type
LIMIT 100