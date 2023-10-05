аналитика в реальном времени

Аналитика в реальном времени относится к обработке данных, которая предоставляет информацию конечным пользователям и клиентам сразу после генерации данных. Она отличается от традиционной или пакетной аналитики, когда данные собираются партиями и обрабатываются, часто через значительное время после их генерации.

Системы аналитики в реальном времени строятся на основе потоков событий, которые состоят из последовательности событий, упорядоченных во времени. Событие — это то, что уже произошло. Это может быть добавление товара в корзину на веб-сайте электронной коммерции, передача показаний от датчика Интернета вещей (IoT) или удар по воротам в футбольном матче.

Событие (с воображаемого датчика IoT) показано ниже в качестве примера:

{ "deviceId": "sensor-001", "timestamp": "2023-10-05T14:30:00Z", "eventType": "temperatureAlert", "data": { "temperature": 28.5, "unit": "Celsius", "thresholdExceeded": true } }

Организации могут выявлять инсайты о своих клиентах, агрегируя и анализируя такие события. Это традиционно делалось с использованием пакетной аналитики, и в следующем разделе мы сравним пакетную и аналитики в реальном времени.

Диаграмма ниже показывает, как будет выглядеть типичная система пакетной аналитики с точки зрения отдельного события:

Вы можете видеть, что существует довольно большая задержка с момента, когда событие происходит, до того, как мы обработаем его и получим некоторые инсайты. Традиционно это был единственный способ анализа данных, и нам нужно было создавать искусственные временные границы для обработки данных партиями. Например, мы могли бы обрабатывать все данные, собранные в конце дня. Это работало для многих случаев использования, но для других это не оптимально, поскольку мы работаем со старыми данными, что не позволяет нам быстро реагировать на данные.

В отличие от этого, в системах аналитики в реальном времени мы реагируем на событие, как только оно происходит, как показано на следующей диаграмме:

Теперь мы можем извлекать инсайты из событий почти сразу после их генерации. Но почему это полезно?

В современном быстро меняющемся мире организации полагаются на аналитику в реальном времени, чтобы оставаться гибкими и реагировать на постоянно меняющиеся условия. Система аналитики в реальном времени может принести бизнесу множество преимуществ.

Процесс принятия решений может быть улучшен за счет доступа к рабочим инсайтам через аналитику в реальном времени. Когда операторы бизнеса могут видеть события по мере их появления, это значительно упрощает возможность своевременного вмешательства.

Например, если мы вносим изменения в приложение и хотим знать, повлияли ли они негативно на пользовательский опыт, мы хотим узнать это как можно быстрее, чтобы, при необходимости, отменить изменения. При менее оперативном подходе нам, возможно, придется ждать до следующего дня для выполнения этого анализа, к тому времени у нас будет много недовольных пользователей.

Аналитика в реальном времени может помочь компаниям генерировать новые источники дохода. Организации могут разрабатывать новые продукты и услуги, основанные на данных, которые предоставляют пользователям доступ к аналитическим возможностям. Эти продукты часто достаточно привлекательны, чтобы пользователи платили за доступ.

Кроме того, существующие приложения могут стать более привлекательными, что увеличит вовлеченность пользователей и их удержание. Это приведет к большему использованию приложения, создавая больше дохода для организации.

С помощью аналитики в реальном времени компании могут получить мгновенные инсайты о поведении, предпочтениях и потребностях клиентов. Это позволяет компаниям предлагать своевременную помощь, персонализировать взаимодействия и создавать более увлекательные впечатления, которые побуждают клиентов возвращаться.

Фактическая ценность аналитики в реальном времени становится очевидной, когда мы рассматриваем ее практическое применение. Давайте рассмотрим некоторые из них.

Обнаружение мошенничества связано с выявлением мошеннических схем, от поддельных аккаунтов до мошенничества с платежами. Нам нужно обнаруживать это мошенничество как можно быстрее, помечая подозрительные действия, блокируя транзакции и отключая аккаунты, когда это необходимо.

Этот сценарий охватывает различные отрасли: здравоохранение, цифровой банкинг, финансовые услуги, розничная торговля и другие.

Instacart является ведущей интернет-компанией по продаже продуктов в Северной Америке, имеющей миллионы активных клиентов и покупателей. Она использует ClickHouse как часть Yoda, своей платформы для обнаружения мошенничества. Кроме общих типов мошенничества, описанных выше, она также пытается обнаружить сговор между клиентами и покупателями.

Они выделили следующие характеристики ClickHouse, которые позволяют осуществлять обнаружение мошенничества в реальном времени:

ClickHouse поддерживает движки семейства MergeTree на основе LSM-дерева. Они оптимизированы для записи, что подходит для приема больших объемов данных в реальном времени.

ClickHouse разработан и оптимизирован специально для аналитических запросов. Это идеально соответствует потребностям приложений, где данные постоянно анализируются на наличие схем, которые могут указывать на мошенничество.

Принятие решений с учетом времени относится к ситуациям, когда пользователи или организации должны быстро принимать обоснованные решения на основе самых актуальных доступных данных. Аналитика в реальном времени дает возможность пользователям принимать обоснованные решения в динамичных условиях, будь то трейдеры, реагирующие на колебания рынка, потребители, принимающие решения о покупке, или профессионалы, адаптирующиеся к оперативным изменениям.

Coinhall предоставляет своим пользователям информацию в реальном времени о движении цен с течением времени через свечной график, который показывает открытые, высокие, низкие и закрывающие цены за каждый торговый период. Им потребовалось иметь возможность быстро выполнять такие запросы с большим количеством пользователей.