Langfuse

Langfuse とは何ですか？

Langfuse は、チームが協力して LLM アプリケーションをデバッグ、分析、および反復的に改善できるようにする、オープンソースの LLM エンジニアリングプラットフォームです。ClickHouse エコシステムの一部であり、その中核として ClickHouse に依存することで、スケーラブルで高性能なオブザーバビリティ向けバックエンドを提供します。

ClickHouse の列指向ストレージと高速な分析機能を活用することで、Langfuse は数十億件規模のトレースやイベントを低レイテンシで処理でき、高スループットな本番ワークロードにも適しています。

なぜ Langfuse なのか？

オープンソース: カスタム連携用の公開 API を備えた完全にオープンソース
本番環境向けに最適化: パフォーマンスのオーバーヘッドを最小限に抑えるように設計
最高クラスの SDKS: Python と JavaScript 向けのネイティブな SDK
フレームワーク対応: OpenAI SDK、LangChain、LlamaIndex などの主要フレームワークと統合
マルチモーダル: テキストや画像など、さまざまなモダリティのトレースをサポート
フルプラットフォーム: LLM アプリケーション開発ライフサイクル全体をカバーするツール群

デプロイメントオプション

Langfuse は、さまざまなセキュリティおよびインフラストラクチャ要件に対応する柔軟なデプロイメントオプションを提供します。

Langfuse Cloud は、最適なパフォーマンスのためにマネージドな ClickHouse クラスターによって動作するフルマネージドサービスです。SOC 2 Type II および ISO 27001 の認証を取得しており、GDPR に準拠し、米国 (AWS us-west-2) と EU (AWS eu-west-1) のデータリージョンで利用可能です。

セルフホスト 版 Langfuse は完全なオープンソース (MIT ライセンス) であり、Docker または Kubernetes を使用して自前のインフラストラクチャ上に無料でデプロイできます。オブザーバビリティデータを保存するために、自分で ClickHouse インスタンスを運用する（または ClickHouse Cloud を使用する）ことで、データを完全に管理できます。

アーキテクチャ

Langfuse はオープンソースコンポーネントのみに依存しており、ローカル環境、クラウドインフラストラクチャ、オンプレミス環境のいずれにもデプロイできます。

ClickHouse: 大量のオブザーバビリティデータ（トレース、スパン、ジェネレーション、スコア）を保存します。ダッシュボード向けの高速な集計と分析を可能にします。
Postgres: ユーザーアカウント、プロジェクト設定、プロンプト定義などのトランザクションデータを保存します。
Redis: イベントのキュー処理とキャッシュを担います。
S3/Blob Storage: 大きなペイロードと生のイベントデータを保存します。

機能

オブザーバビリティ

Observability は、LLM アプリケーションを理解し、デバッグするうえで不可欠です。従来のソフトウェアとは異なり、LLM アプリケーションでは複雑で非決定的なやり取りが発生するため、監視やデバッグが難しい場合があります。Langfuse は包括的なトレース機能を提供し、アプリケーション内で何が起きているのかを正確に把握するのに役立ちます。

📹 さらに詳しく知りたいですか？ Langfuse Observability とそれをアプリケーションに統合する方法については、エンドツーエンドのウォークスルー動画をご覧ください。

トレースを使うと、アプリ内のすべての LLM 呼び出しとその他の関連ロジックを追跡できます。

各ユーザーのコストと使用状況を監視するために、独自の userId を追加します。必要に応じて、システム内からこのビューへのディープリンクを作成することもできます。

プロンプト管理

プロンプト管理は、効果的な LLM アプリケーションを構築するうえで極めて重要です。Langfuse は、開発ライフサイクル全体を通じてプロンプトを管理・バージョン管理・最適化するためのツールを提供します。

📹 さらに詳しく知りたい場合は、Langfuse の Prompt Management とそれをアプリケーションに統合する方法について解説した エンドツーエンドのウォークスルー動画をご覧ください。

UI、SDKs、または API を使用して新しいプロンプトを作成します。

評価とデータセット

Evaluation は、LLM アプリケーションの品質と信頼性を確保するうえで重要です。Langfuse は、開発中のテストでも本番環境でのパフォーマンス監視でも、特定のニーズに合わせて柔軟に適応する評価ツールを提供します。

📹 さらに詳しく知りたいですか？ Langfuse Evaluation と、それを使って LLM アプリケーションを改善する方法については、エンドツーエンドのウォークスルー動画をご覧ください。

Langfuse Dashboard で評価結果を可視化します。

カスタム評価結果を追加できます。数値、真偽値、カテゴリ値をサポートします。

POST /api/public/scores

Python または JS SDK を使ってスコアを追加します。

langfuse.score(
  trace_id="123",
  name="my_custom_evaluator",
  value=0.5,
)

クイックスタート

数分で Langfuse を使い始められます。現在のニーズに最も適した方法を選択してください：

Langfuse とは何ですか？​

なぜ Langfuse なのか？​

デプロイメントオプション​

アーキテクチャ​

機能​

オブザーバビリティ​

プロンプト管理​

評価とデータセット​

クイックスタート​

さらに詳しく​