Перейти к основному содержимому
Перейти к основному содержимому

groupArrayResample

Description

Комбинатор Resample может быть применен к агрегатной функции groupArray для разделения диапазона указанной ключевой колонки на фиксированное количество интервалов (N) и построения результирующего массива, выбирая одно представительское значение (соответствующее минимальному ключу) из точек данных, попадающих в каждый интервал. Он создает уменьшенную выборку данных вместо того, чтобы собирать все значения.

Example Usage

Рассмотрим пример. Мы создадим таблицу, которая содержит name, age и wage сотрудников и вставим в нее данные:

Теперь получим имена людей, чей возраст находится в интервалах [30,60) и [60,75). Поскольку мы используем целочисленное представление для возраста, мы получаем возраста в интервалах [30, 59] и [60,74].

Чтобы агрегировать имена в массив, мы используем агрегатную функцию groupArray. Она принимает один аргумент. В нашем случае это колонка имени. Функция groupArrayResample должна использовать колонку возраста для агрегирования имен по возрасту. Чтобы определить необходимые интервалы, мы передаем 30, 75, 30 в качестве аргументов в функцию groupArrayResample:

See also