Langfuse

Langfuse란 무엇입니까?

Langfuse는 팀이 LLM 애플리케이션을 협업하여 디버깅하고, 분석하고, 반복 개선할 수 있도록 돕는 오픈 소스 LLM 엔지니어링 플랫폼입니다. ClickHouse 생태계의 일부이며, 핵심에 ClickHouse를 사용하여 확장 가능하고 고성능인 관측성 관측성 백엔드를 제공합니다.

ClickHouse의 열 지향 스토리지와 빠른 분석 기능을 활용하여 Langfuse는 수십억 개의 트레이스와 이벤트를 낮은 지연 시간으로 처리할 수 있어, 높은 처리량이 필요한 프로덕션 워크로드에도 적합합니다.

Langfuse를 선택해야 하는 이유

오픈 소스: 커스텀 통합을 위한 공개 API를 포함한 완전한 오픈 소스입니다.
프로덕션 최적화: 성능 오버헤드를 최소화하도록 설계되었습니다.
최고 수준 SDKS: Python 및 JavaScript용 네이티브 SDK를 제공합니다.
프레임워크 지원: OpenAI SDK, LangChain, LlamaIndex 등 인기 있는 프레임워크와 통합됩니다.
멀티 모달: 텍스트, 이미지 및 기타 모달리티에 대한 트레이싱을 지원합니다.
완전한 플랫폼: LLM 애플리케이션 전체 개발 수명 주기를 위한 종합 도구 모음을 제공합니다.

배포 옵션

Langfuse는 다양한 보안 및 인프라 요구 사항을 충족할 수 있도록 유연한 배포 옵션을 제공합니다.

**Langfuse Cloud**는 최적의 성능을 위해 관리형 ClickHouse 클러스터를 기반으로 한 완전 관리형 서비스입니다. SOC 2 Type II 및 ISO 27001 인증을 받았으며, GDPR을 준수하고 미국(AWS us-west-2)과 EU(AWS eu-west-1) 데이터 리전에서 제공됩니다.

Self-hosted Langfuse는 완전 오픈 소스(MIT 라이선스)이며 Docker 또는 Kubernetes를 사용하여 자체 인프라에 무료로 배포할 수 있습니다. 관측성 데이터를 저장하기 위해 자체 ClickHouse 인스턴스를 운영하거나 ClickHouse Cloud를 사용할 수 있으며, 이를 통해 데이터에 대한 완전한 통제권을 유지할 수 있습니다.

아키텍처

Langfuse는 오픈 소스 구성 요소에만 의존하며 로컬, 클라우드 인프라 또는 온프레미스 환경에 배포할 수 있습니다:

ClickHouse: 대량의 관측성 데이터(트레이스, 스팬, 생성 결과, 점수)를 저장합니다. 대시보드를 위한 빠른 집계와 분석을 제공합니다.
Postgres: 사용자 계정, 프로젝트 설정, 프롬프트 정의와 같은 트랜잭션 데이터를 저장합니다.
Redis: 이벤트 큐잉과 캐싱을 처리합니다.
S3/Blob Storage: 대용량 페이로드와 원시 이벤트 데이터를 저장합니다.

기능

Observability

Observability는 LLM 애플리케이션을 이해하고 디버깅하는 데 필수적입니다. 기존 소프트웨어와 달리 LLM 애플리케이션은 복잡하고 비결정적인 상호작용을 수반하므로 모니터링하고 디버깅하기가 어려울 수 있습니다. Langfuse는 애플리케이션에서 정확히 어떤 일이 일어나고 있는지 이해하는 데 도움이 되는 포괄적인 트레이싱 기능을 제공합니다.

📹 더 자세히 알고 싶으신가요? Langfuse Observability와 이를 애플리케이션에 통합하는 방법에 대한 엔드 투 엔드 데모 영상을 시청해 보세요.

트레이스를 사용하면 앱의 모든 LLM 호출과 기타 관련 로직을 추적할 수 있습니다.

각 사용자별 비용과 사용량을 모니터링할 수 있도록 자체 userId를 추가합니다. 필요하다면 시스템에서 이 뷰로 연결되는 딥 링크를 만들 수도 있습니다.

프롬프트 관리

프롬프트 관리는 효과적인 LLM 애플리케이션을 구축하는 데 매우 중요합니다. Langfuse는 개발 수명 주기 전반에 걸쳐 프롬프트를 관리하고, 버전 관리하며, 최적화하는 데 도움이 되는 도구를 제공합니다.

📹 더 자세히 알고 싶다면 Langfuse 프롬프트 관리와 애플리케이션에 통합하는 방법을 보여주는 엔드 투 엔드 데모 영상을 시청하십시오.

UI, SDKs 또는 API를 통해 새 프롬프트를 생성하십시오.

평가 & datasets

평가는 LLM 애플리케이션의 품질과 신뢰성을 보장하는 데 매우 중요합니다. Langfuse는 개발 중 테스트하든 프로덕션 성능을 모니터링하든, 구체적인 요구 사항에 맞게 조정할 수 있는 유연한 평가 도구를 제공합니다.

📹 더 알고 싶으신가요? Langfuse Evaluation과 이를 사용해 LLM 애플리케이션을 개선하는 방법에 대한 엔드 투 엔드 데모 영상을 시청해 보세요.

Langfuse 대시보드에서 평가 결과를 시각화합니다.

커스텀 평가 결과를 추가할 수 있으며, 숫자형, 불리언, 범주형 값을 지원합니다.

POST /api/public/scores

Python 또는 JS SDK를 통해 점수를 추가합니다.

langfuse.score(
  trace_id="123",
  name="my_custom_evaluator",
  value=0.5,
)

빠른 시작

몇 분이면 Langfuse를 시작할 수 있습니다. 현재 필요에 가장 잘 맞는 경로를 선택하십시오:

Langfuse란 무엇입니까?​

Langfuse를 선택해야 하는 이유​

배포 옵션​

아키텍처​

기능​

Observability​

프롬프트 관리​

평가 & datasets​

빠른 시작​

더 알아보기​