groupArrayResample
Description
Комбинатор Resample
может быть применен к агрегатной функции groupArray
для
разделения диапазона указанной ключевой колонки на фиксированное количество интервалов (N
)
и построения результирующего массива, выбирая одно представительское значение
(соответствующее минимальному ключу) из точек данных, попадающих в каждый интервал.
Он создает уменьшенную выборку данных вместо того, чтобы собирать все значения.
Example Usage
Рассмотрим пример. Мы создадим таблицу, которая содержит name
, age
и
wage
сотрудников и вставим в нее данные:
Теперь получим имена людей, чей возраст находится в интервалах [30,60)
и [60,75)
. Поскольку мы используем целочисленное представление для возраста, мы получаем возраста в интервалах
[30, 59]
и [60,74]
.
Чтобы агрегировать имена в массив, мы используем агрегатную функцию groupArray
.
Она принимает один аргумент. В нашем случае это колонка имени. Функция groupArrayResample
должна использовать колонку возраста для агрегирования имен по возрасту. Чтобы определить
необходимые интервалы, мы передаем 30
, 75
, 30
в качестве аргументов в функцию groupArrayResample
: