Langfuse — это платформа для инженерии LLM с открытым исходным кодом, которая помогает командам совместно отлаживать, анализировать и итеративно улучшать LLM-приложения. Она является частью экосистемы ClickHouse и опирается в своей основе на ClickHouse, обеспечивая масштабируемый, высокопроизводительный бэкенд обсервабилити.

Благодаря столбцовой системе хранения и быстрым аналитическим возможностям ClickHouse Langfuse может обрабатывать миллиарды трейсов и событий с низкой задержкой, что делает её подходящей для production-нагрузок с высокой пропускной способностью.

Open source: Полностью открытый исходный код с публичным API для пользовательских интеграций

Полностью открытый исходный код с публичным API для пользовательских интеграций Оптимизирован для продакшн-среды: Спроектирован с минимальными накладными расходами на производительность

Спроектирован с минимальными накладными расходами на производительность Лучшие в своём классе SDKs: Нативные SDKs для Python и JavaScript

Нативные SDKs для Python и JavaScript Поддержка фреймворков: Интеграция с популярными фреймворками, такими как OpenAI SDK, LangChain и LlamaIndex

Интеграция с популярными фреймворками, такими как OpenAI SDK, LangChain и LlamaIndex Мультимодальность: Поддержка трассировки текста, изображений и других модальностей

Поддержка трассировки текста, изображений и других модальностей Полноценная платформа: Набор инструментов для полного жизненного цикла разработки LLM-приложений

Langfuse предлагает гибкие варианты развертывания для различных требований к безопасности и инфраструктуре.

Langfuse Cloud — это полностью управляемый сервис на базе управляемого кластера ClickHouse для оптимальной производительности. Он сертифицирован по SOC 2 Type II и ISO 27001, соответствует требованиям GDPR и доступен в регионах обработки данных в США (AWS us-west-2) и ЕС (AWS eu-west-1).

Самостоятельное развертывание Langfuse — полностью открытое ПО (лицензия MIT) и может бесплатно развертываться в вашей собственной инфраструктуре с использованием Docker или Kubernetes. Вы запускаете собственный экземпляр ClickHouse (или используете ClickHouse Cloud) для хранения данных обсервабилити, обеспечивая полный контроль над вашими данными.

Langfuse зависит только от компонентов с открытым исходным кодом и может быть развернут локально, в облачной инфраструктуре или в инфраструктуре заказчика (on-premises):

ClickHouse : Хранит большие объёмы данных обсервабилити (трейсы, спаны, генерации, оценки). Обеспечивает быструю агрегацию и аналитику для дашбордов.

: Хранит большие объёмы данных обсервабилити (трейсы, спаны, генерации, оценки). Обеспечивает быструю агрегацию и аналитику для дашбордов. Postgres : Хранит транзакционные данные, такие как учётные записи пользователей, конфигурации проектов и определения промптов.

: Хранит транзакционные данные, такие как учётные записи пользователей, конфигурации проектов и определения промптов. Redis : Отвечает за очереди событий и кэширование.

: Отвечает за очереди событий и кэширование. S3/Blob Storage: Хранит крупные полезные данные (payloads) и сырые данные событий.

Обсервабилити имеет ключевое значение для понимания и отладки LLM-приложений. В отличие от традиционного ПО, LLM-приложения включают сложные, недетерминированные взаимодействия, которые трудно отслеживать и отлаживать. Langfuse предоставляет расширенные возможности трассировки, которые помогают точно понять, что происходит в вашем приложении.

📹 Хотите узнать больше? Посмотрите сквозной обзор Langfuse Observability и того, как интегрировать его с вашим приложением.

Детали трассировки

Сессии

Хронология

Пользователи

Графы агентов

Дашборд Трейсы позволяют отслеживать каждый вызов LLM и другую связанную логику в вашем приложении. Сессии позволяют отслеживать многошаговые диалоги или агентные рабочие процессы. Отлаживайте проблемы с задержками, анализируя представление временной шкалы. Добавьте собственный userId , чтобы отслеживать стоимость и использование для каждого пользователя. Дополнительно вы можете создать глубокую ссылку (deep link) на это представление в ваших системах. LLM-агенты могут быть визуализированы в виде графа, чтобы отобразить поток сложных агентных рабочих процессов. Просматривайте метрики качества, стоимости и задержек в дашборде, чтобы отслеживать ваше LLM-приложение.

Управление промптами критически важно для создания эффективных LLM-приложений. Langfuse предоставляет инструменты, которые помогают управлять промптами, версионировать их и оптимизировать на протяжении всего жизненного цикла разработки.

📹 Хотите узнать больше? Посмотрите сквозной обзор Langfuse Prompt Management и его интеграции с вашим приложением.

Create

Version Control

Deploy

Metrics

Test in Playground

Link with Traces

Track Changes Создавайте новые промпты через UI, SDKS или API. Совместно версионируйте и редактируйте промпты через UI, API или SDKS. Развёртывайте промпты в продакшн или любую другую среду с помощью меток — без изменений кода. Сравнивайте задержку, стоимость и метрики качества для разных версий ваших промптов. Мгновенно тестируйте ваши промпты в песочнице (playground). Связывайте промпты с трейсами, чтобы понять, как они работают в контексте вашего LLM-приложения. Отслеживайте изменения в ваших промптах, чтобы понимать, как они меняются со временем.

Оценка имеет ключевое значение для обеспечения качества и надежности ваших LLM‑приложений. Langfuse предоставляет гибкие инструменты оценки, которые адаптируются к вашим конкретным требованиям, будь то тестирование в процессе разработки или мониторинг производительности в продакшене.

📹 Хотите узнать больше? Посмотрите сквозной разбор Langfuse Evaluation и того, как использовать его для улучшения вашего LLM‑приложения.

Analytics

User Feedback

LLM-as-a-Judge

Experiments

Annotation Queue

Custom Evals Стройте графики результатов оценки в панели управления Langfuse. Собирайте обратную связь от ваших пользователей. Ее можно собирать на фронтенде через наш Browser SDK, на стороне сервера через SDKS или API. Видеоролик содержит пример приложения. Запускайте полностью управляемые оценки LLM‑as‑a‑judge для продакшен‑ и дев‑трейсов. Может применяться к любому шагу внутри вашего приложения для пошаговой оценки. Оценивайте промпты и модели на наборах данных напрямую в пользовательском интерфейсе. Пользовательский код не требуется. Определите базовый уровень вашего процесса оценки с помощью человеческой разметки через очереди аннотаций (Annotation Queues). Добавляйте пользовательские результаты оценки; поддерживаются числовые, булевы и категориальные значения. POST /api/public/scores Добавляйте оценки через Python или JS SDK. langfuse.score( trace_id="123", name="my_custom_evaluator", value=0.5, )

Начните работу с Langfuse за несколько минут. Выберите вариант, который лучше всего соответствует вашим текущим задачам: