approx_top_sum
Возвращает массив приблизительно наиболее часто встречающихся значений и количества их вхождений в указанном столбце. Результирующий массив отсортирован по убыванию приблизительной частоты значений (не по самим значениям). Также учитывается вес значений.
Эта функция не гарантирует точный результат. В некоторых ситуациях возможны погрешности, и она может возвращать часто встречающиеся значения, которые не являются наиболее частыми.
Рекомендуем использовать N < 10; при больших значениях N производительность снижается. Максимальное значение N = 65536.
Параметры
N— Количество элементов, которые нужно вернуть. Необязательный параметр. Значение по умолчанию: 10.reserved— Определяет, сколько ячеек зарезервировано для значений. Если uniq(column) > reserved, результат функции topK будет приближённым. Необязательный параметр. Значение по умолчанию: N * 3.
Аргументы
column— Значение, для которого вычисляется частота.weight— Вес. Каждое значение учитываетсяweightраз при вычислении частоты. UInt64.
Пример
Запрос:
Результат:
См. также