approx_top_k

Введена в: v1.1.0

Возвращает массив приблизительно наиболее часто встречающихся значений и количества их вхождений в указанном столбце. Полученный массив отсортирован по убыванию приблизительной частоты значений (не по самим значениям).

Эта функция не гарантирует точный результат. В некоторых ситуациях возможны ошибки, и функция может вернуть часто встречающиеся значения, которые не являются наиболее частыми.

Синтаксис

approx_top_k(N[, reserved])(column)

Псевдонимы: approx_top_count

Параметры

N — Количество возвращаемых элементов. Значение по умолчанию: 10. Максимальное значение: N = 65536. UInt64
reserved — Необязательный параметр. Определяет, сколько ячеек будет зарезервировано для значений. Если uniq(column) > reserved, результат будет приблизительным. Значение по умолчанию: N * 3. UInt64

Аргументы

column — Имя столбца, для которого нужно найти наиболее часто встречающиеся значения. String

Возвращаемое значение

Возвращает массив приблизительно наиболее часто встречающихся значений и количества их вхождений, отсортированный по убыванию приблизительной частоты. Array

Примеры

Пример использования

SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));

┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘

См. также

approx_top_k​

approx_top_k