Функции quantileExact
quantileExact
Точно вычисляет квантиль для числовой последовательности данных.
Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — количество переданных значений. Однако для небольшого количества значений функция очень эффективна.
При использовании нескольких функций quantile* с разными уровнями в одном запросе их внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.
Синтаксис
Псевдоним: medianExact.
Аргументы
level— уровень квантиля. Необязательный параметр. Константное число с плавающей запятой от 0 до 1. Рекомендуется использовать значениеlevelв диапазоне[0.01, 0.99]. Значение по умолчанию: 0.5. Приlevel=0.5функция вычисляет медиану.expr— выражение над значениями столбца, результатом которого может быть числовой тип данных, Date или DateTime.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Для числовых типов данных формат результата будет таким же, как формат входных данных. Например:
Пример
Запрос:
Результат:
quantileExactLow
Аналогично quantileExact, вычисляет точный квантиль числовой последовательности данных.
Чтобы получить точное значение, все переданные значения объединяются в массив, который затем полностью сортируется. Сложность алгоритма сортировки составляет O(N·log(N)), где N = std::distance(first, last) сравнений.
Возвращаемое значение зависит от уровня квантиля и количества элементов в выборке, то есть если уровень равен 0.5, функция возвращает нижнее значение медианы для чётного количества элементов и среднее значение медианы для нечётного количества элементов. Медиана вычисляется аналогично реализации median_low, используемой в Python.
Для всех остальных уровней возвращается элемент с индексом, соответствующим значению level * size_of_array. Например:
При использовании нескольких функций quantile* с разными уровнями в одном запросе внутренние состояния функций не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.
Синтаксис
Синоним: medianExactLow.
Аргументы
level— уровень квантиля. Необязательный параметр. Константное число с плавающей запятой от 0 до 1. Рекомендуется использовать значениеlevelв диапазоне[0.01, 0.99]. Значение по умолчанию: 0.5. Приlevel=0.5функция вычисляет медиану.expr— выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Float64 для числовых типов данных на входе.
- Date, если входные значения имеют тип
Date. - DateTime, если входные значения имеют тип
DateTime.
Пример
Запрос:
Результат:
quantileExactHigh
Аналогично quantileExact, эта функция вычисляет точный квантиль последовательности числовых данных.
Все переданные значения объединяются в массив, который затем полностью сортируется для получения точного значения. Сложность алгоритма сортировки составляет O(N·log(N)), где N = std::distance(first, last) сравнений.
Возвращаемое значение зависит от уровня квантили и количества элементов в выборке, например, если уровень равен 0.5, то функция возвращает большее из двух медианных значений для чётного числа элементов и среднее (единственное) медианное значение для нечётного числа элементов. Медиана вычисляется аналогично реализации функции median_high, которая используется в Python. Для всех остальных уровней возвращается элемент по индексу, соответствующему значению level * size_of_array.
Эта реализация ведёт себя точно так же, как текущая реализация функции quantileExact.
При использовании нескольких функций quantile* с разными уровнями в одном запросе их внутренние состояния не объединяются (то есть запрос выполняется менее эффективно, чем мог бы). В таком случае используйте функцию quantiles.
Синтаксис
Синоним: medianExactHigh.
Аргументы
level— уровень квантиля. Необязательный параметр. Константное число с плавающей запятой от 0 до 1. Рекомендуется использовать значениеlevelв диапазоне[0.01, 0.99]. Значение по умолчанию: 0.5. Приlevel=0.5функция вычисляет медиану.expr— выражение над значениями столбца, результатом которого будут числовые типы данных, Date или DateTime.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Float64 для числового типа данных.
- Date, если входные значения имеют тип
Date. - DateTime, если входные значения имеют тип
DateTime.
Пример
Запрос:
Результат:
quantileExactExclusive
Точно вычисляет квантиль последовательности числовых данных.
Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — количество переданных значений. Однако для небольшого количества значений функция очень эффективна.
Эта функция эквивалентна функции Excel PERCENTILE.EXC (тип R6).
При использовании нескольких функций quantileExactExclusive с разными уровнями в одном запросе их внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantilesExactExclusive.
Синтаксис
Аргументы
expr— выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.
Параметры
level— уровень квантиля. Необязательный параметр. Допустимые значения: (0, 1) — границы не включены. Значение по умолчанию: 0.5. Приlevel=0.5функция вычисляет медиану. Тип параметра: Float.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Float64 для числового типа данных на входе.
- Date, если входные значения имеют тип
Date. - DateTime, если входные значения имеют тип
DateTime.
Пример
Запрос:
Результат:
quantileExactInclusive
Точно вычисляет квантиль числовой последовательности данных.
Чтобы получить точное значение, все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — количество переданных значений. Однако при небольшом количестве значений функция работает очень эффективно.
Эта функция эквивалентна функции Excel PERCENTILE.INC (тип R7).
При использовании нескольких функций quantileExactInclusive с разными уровнями в одном запросе их внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantilesExactInclusive.
Синтаксис
Аргументы
expr— выражение над значениями столбца, которое возвращает числовые типы данных, Date или DateTime.
Параметры
level— уровень квантиля. Необязательный параметр. Возможные значения: [0, 1] — границы включены. Значение по умолчанию: 0.5. Приlevel=0.5функция вычисляет медиану. Float.
Возвращаемое значение
- Квантиль указанного уровня.
Тип:
- Float64 для числового типа данных на входе.
- Date, если входные значения имеют тип
Date. - DateTime, если входные значения имеют тип
DateTime.
Пример
Запрос:
Результат:
См. также