オブザーバビリティの未来は、特定ベンダーのAI エージェントによってもたらされるものではありません。各チームが構築する何千ものエージェントによって築かれていくのです。

現在、オブザーバビリティ分野でベンダーが共通して賭けているのは「収束 (convergence)」です。

単一のSREエージェントが、単一のプラットフォームに組み込まれ、単一のベンダーが描く「インシデントはこう調査すべき」という視点に沿って訓練される。テレメトリーを理解し、質問に答え、何が間違っていたかを説明し、最終的には誰かがダッシュボードを開く前に本番環境を修復する手助けまでする——そんな世界です。

その未来は確かに有用ではあるものの、視野が狭すぎるとも言えます。オブザーバビリティは、汎用的なサポートキューのようには機能しません。デバッグは、チームが所有するシステム、そのシステムが壊れる仕方、信頼するデータ、従うランブック、使用するツール、そして長年積み重ねてきた運用上の傷跡によって形作られます。データベースチーム、フロントエンドチーム、決済チーム、インフラチームが、同じやり方で本番環境を調査することはありません。

本記事では、オブザーバビリティの未来が、単一のプロプライエタリなAIエージェントではなく、あなたのようなチームによって構築される何千ものエージェントになると私たちが考える理由を探ります。

AIエージェントがオブザーバビリティの新しいインターフェースになりつつある

オブザーバビリティにおけるAIエージェントへのシフトが、もはや特別に大胆な予測ではないことには、多くの人が同意してくれると思います。

今日、ほとんどの調査は、人間がダッシュボードを開き、ログを検索し、トレースを調べ、コンテキストを手動で集めるところから始まります。しかし、その作業はますますエージェントに委ねられつつあります。モデルはすでに、テレメトリーをクエリし、調査結果を要約し、パターンを特定し、システム内で何が起きているかについてもっともらしい仮説を生成する能力を持っています。

モデルの改善が続くにつれて、オブザーバビリティへのインターフェースは「人間 → ダッシュボード → データ」から「人間 → エージェント → データ」へとますますシフトしていきます。エンジニアは依然としてどのアクションを取るかを決定しますが、調査における機械的な作業の多くは、彼らがチャートに触れたりクエリを書いたりする前にすでに完了しているでしょう。

「実際、私たちのSlackインシデントチャンネルでトレンドの変化が見られます。以前はエンジニアがログやメトリクスへのリンクを共有していましたが、今ではチームがAIによる調査結果のスニペットを共有し、それを深掘りしています。」

Anil K, DoorDash

AIはオブザーバビリティのワークロードの形を変える

オブザーバビリティ・エージェントに関する議論の多くは、エージェントに「何ができるか」に焦点を当てています。それがワークフローの当たり前の一部になったとき、その下で何が起きるかに対しては、はるかに少ない注意しか払われていません。

人間の調査者は比較的制約があります。いくつかのダッシュボードを開き、いくつかのクエリを実行し、1つか2つのトレースを調べ、徐々に検索空間を絞り込んでいきます。経験豊富なエンジニアであっても、一度に評価できる可能性の数には限界があります。

エージェントにはそうした制約がありません。エンジニアが2つの時間枠を比較する場合でも、エージェントは20を比較できます。人間がいくつかの可能性の高い原因を手動で調査するのに対し、エージェントは数十の仮説を同時に追求し、証拠を継続的に収集しながら行き止まりを排除していけます。

実務上の結果として、調査はより広範になり、基盤システムへの要求がより大きくなります。エージェントは、答えに収束するまでに、より多くの履歴データを精査し、はるかに多くの潜在的な説明を探索できます。これにより、低レイテンシの応答を必要とするクエリが増えることになります。

「エージェントは力技でやれてしまいます——私がクエリすればダッシュボードを2回クリックするだけのところを、10回のクエリを発行する。つまり、私たちのAPIレイヤーやストレージは、そうした非線形なクエリパターンに耐えられるよう堅牢でなければなりません。」

Anil K, DoorDash

これは、基盤となるデータに対する要件も変えます。エージェントは、与えられたコンテキストの範囲内でしか推論できません。履歴データが破棄されていれば、重要なコンテキストが失われている可能性があります。テレメトリーが大幅にサンプリングされていれば、決定的な証拠がデータセット内に単純に存在しないかもしれません。経験豊富なエンジニアと違い、エージェントは直感や組織知でこうしたギャップを補うことはできません。彼らの結論は、利用可能なデータの完全性と忠実度によって制約されます。

ほとんどのオブザーバビリティ・プラットフォームは、人間の調査者と彼らが生成するワークロードを中心に設計されています。次世代のプラットフォームは、人間に代わって実行される調査を、ますますサポートする必要があるでしょう。

「偉大なるSREエージェント」に賭ける業界

多くの企業が、シンプルな未来像——ユニバーサルSREエージェント——を構築することに投資しています。

これは魅力的なアイデアです。オブザーバビリティ・ベンダーがプラットフォーム、データ、エージェントを提供する。エンジニアは、ダッシュボードの使い方を学んだり、クエリを書いたり、テレメトリーをナビゲートしたりする代わりに、自然言語で質問する。時間が経つにつれて、エージェントはますます有能になり、最終的には調査プロセスの多くを自ら処理するようになる。

このモデルには本当の価値があります。ほとんどのオブザーバビリティ・ツールは依然として使いにくく、エージェントは複雑なシステムの理解と運用の障壁を劇的に下げる可能性を持っています。

モデルも改善を続け、推論能力、SQLの記述能力、そして一般的な調査パターンを再利用可能なワークフローにパッケージ化する能力も向上していくでしょう。今日、私たちが専門知識と見なしているものの多くが、エージェントを通じてますますアクセスしやすくなっていきます。

デバッグの難しさ:コンテキスト

問題は、ソフトウェアベンダーが望むほどには、デバッグがきれいに収束しないことです。

モデルは改善を続けますが、依然として難しいのはコンテキストです。

調査における次の一歩は、オブザーバビリティ・プラットフォーム内に存在するテレメトリーをはるかに超えた要素に依存します。それは、チームがどのように運営されているか、どのシグナルを信頼しているか、過去に何が壊れたか、所有権はどう分担されているか、運用知識がどこに存在するかに依存します。そうしたコンテキストの多くは、ランブック、チケット、ポストモーテム、Slackスレッド、社内ドキュメント、デプロイシステム、そして経験豊富なエンジニアの頭の中に散らばっています。

「Ring Centralは25年の歴史を持つ会社です。運用チーム内にはどこにも文書化されていない暗黙知が多くあります。すべてのWikiを接続したとしてもです。データを与えなければ、ただハルシネーションを起こすだけです。」

Sushant Hiray, AI Leader, RingCentral

すべてのチームは異なる働き方をしている

さらに、似たような技術スタックを動かしている2つの企業が、システム、チーム、運用履歴が異なるために、同じインシデントをまったく異なる方法で調査することもあります。ベンダーはベストプラクティスをパッケージ化できますが、自社製品を使用するすべてのエンジニアリングチームが蓄積してきた経験をパッケージ化することはできません。

本番システムをデバッグするために必要なコンテキストの多くは、オブザーバビリティ・プラットフォームそのものの外側に存在します。それは、ランブック、チケット、ポストモーテム、社内ドキュメント、Slackスレッド、デプロイシステム、そして長年そのシステムを運用してきたエンジニアの組織知に散らばっています。その知識の所在、チームの構成方法、彼らが従うプロセスは、組織間だけでなく、業界や組織内の職能によっても異なります。

これらのアプローチのいずれかが本質的に正しいということはありません。それらは単に、経験を通じて構築された異なるメンタルモデルを反映しているだけです。チームが信頼するシグナル、従うワークフロー、依拠するコンテキストは、しばしば、彼らが運用するシステムに固有のものです。

エージェント型オブザーバビリティのためのよりオープンなモデル

これらの課題を総合すると、多くのベンダーが賭けているものとは大きく異なる未来が示唆されます。

エージェントがオブザーバビリティの主要なインターフェースとなり、調査が組織のコンテキストによってますます形作られるようになるにつれて、価値は単一のユニバーサルエージェントから、特定のチームやドメイン向けに構築されたエージェントへとシフトします。

「最初から完成された超洗練された仕組みを構築するのではなく、ヘッドレスなプラットフォームの構築——APIやデータストレージの改善——に注力し、オブザーバビリティMCPを構築することで、すべてのエンジニアやチームが、自分たちのデバッグユースケースにより適合したエージェント型ワークフローを自ら構築できるようにしました。」

Anil K., DoorDash

単一のSREエージェントへ収束するのではなく、オブザーバビリティは、特定の組織、チーム、または問題領域に最適化された、専門化されたエージェントのエコシステムへと進化する可能性が高いと私たちは考えています。あるものはインフラストラクチャに焦点を当て、別のものはデータベース、セキュリティ、決済、カスタマーエクスペリエンス、社内プラットフォームに焦点を当てるでしょう。多くは、組織独自のランブック、ドキュメント、ワークフロー、ビジネスロジック、運用知識を中心に構築されることになります。

同様に重要なのは、この未来が「オープンさ」に依存しているという点です。

「オープンさ」とは、単にオープンソースソフトウェアを意味するのではありません。チームや個々のエンジニアに、スタックの各レイヤー——モデル、ハーネス、ツール、ワークフロー、インターフェース——に対して最適な技術を選択する自由を与えることを意味します。ベンダーが描く「オブザーバビリティはこうあるべき」という見解にプロセスを適合させるのではなく、組織内にすでに存在するシステムやプロセスを中心にエージェントを構築できるということです。

それはまた、それらのエージェントの下にあるレイヤーを選択する自由を持つことも意味します。チームは、データがどこに存在するか、スキルがどのように開発・管理されるか、どのMCPゲートウェイやサーバーが本番システムの前段に置かれるか、そしてエージェントの振る舞いがどのように観察・統制され、エンジニアリング環境の他の部分と統合されるかをコントロールできるべきです。

「私たちが好むやり方は、私たちがその上に構築する機会が得られる程度の柔軟性を提供してくれるプラットフォームとパートナーシップを組むことです。社内ツールの十分な部分と連携できる限り、それがスイートスポットです。」

Sushant Hiray, AI Leader, RingCentral

最も成功するオブザーバビリティ・プラットフォームは、すべての人を単一の働き方に押し込めるものではないでしょう。それは、何千もの異なるエージェントを構築できる共通の基盤を提供するプラットフォームです。

エージェントには共有コンテキストが必要

あらゆるチーム、あるいは個人までもが、自分たちのエージェントを構築・適応させるようになれば、調査は1つの場所で行われるものではなくなります。あるエンジニアはIDEで、別のエンジニアはノートブックで、また別のエンジニアは社内チャットインターフェースで、そしてさらに別のエンジニアはカスタムのインシデントワークフローを通じて、調査を始めることになります。エージェントは異なるハーネスで動作し、異なるモデルを使用し、異なる調査パスをたどることがあるでしょう——たとえそれらすべてが同じ本番環境の問題を理解しようとしているときであっても。

これはコラボレーションの問題を生み出します。調査の出力結果は、一時的なチャットセッションや非公開のエージェントトレースの中に閉じ込められたままでは困ります。チームには、何がクエリされたか、どのような証拠が見つかったか、どの仮説が探求されたか、なぜその結論に至ったかを示す、永続的かつ検査可能なアーティファクトが必要です。これは、インシデントをレビューする人間にとって重要なだけでなく、毎回ゼロから始めるのではなく、過去の調査から学ぶ必要のある将来のエージェントにとっても重要なのです。

Loading video...

その結果、エージェント型オブザーバビリティでは、人間とエージェントが協働できる、永続的な調査の場が何らかの形で必要になります。調査内容を共有し、レビューし、再実行し、洗練させ、時間をかけて積み上げていける場所です。調査がIDEから始まるのか、ノートブックから始まるのか、チャットインターフェースから始まるのか、あるいはカスタムワークフローから始まるのかは、結果を保存して再利用できる共通の場があることに比べれば、最終的にはそれほど重要ではありません。

これらの調査アーティファクトは、単に何が起きたかという記録にとどまりません。それらは、将来のエンジニアや将来のエージェントが同様の問題に直面したときに参照できる、運用知識の蓄積となっていきます。

人間は依然としてコントロールプレーンであり続ける

これらすべての前提として、少なくとも当面の間は、人間がコントロールプレーンに留まり続けるということがあります。

エージェントは、証拠を収集し、調査を実行し、仮説を探り、関連するコンテキストを浮かび上がらせることを、どの個々のエンジニアよりもはるかに高速に行うことができます。しかし、ビジネス上の優先順位を理解し、競合するリスクを比較検討し、曖昧さに対処し、最終的にどのようなアクションを取るべきかを判断するために必要な判断力を、エージェントはまだ持ち合わせていません。それらの意思決定は、システムを運用する人々の責任のままです。

おそらく、それも時間とともに変化していくでしょう。専門化されたエージェント同士が協調し、システムを継続的に監視し、人間の関与なしに一定の種類のインシデントを自律的に解決していく未来は、容易に想像できます。しかし、それは今日私たちが構築しようとしている未来ではありません。

今日においては、より実用的で有用なモデルは協働です。エージェントが調査を加速させ、人間が方向性を示す。エージェントがコンテキストを集め、人間が意思決定を行う。ノートブックは、そうしたやり取りが行われる共有ワークスペースとなり、検査・共有・洗練・再利用が可能な永続的な記録を生み出します。

未来が最終的に完全な自律型になるのか、それとも恒久的に人間がガイドする形にとどまるのかにかかわらず、ますますはっきりしてきていることが一つあります。それは、オブザーバビリティの未来は、単一ベンダーのインターフェースの背後に鎮座する一つのプロプライエタリなAIエージェントではない、ということです。

その未来は、あなた自身によって構築された何千ものエージェントになるのです。

Managed ClickStack を今すぐ始めよう

Managed ClickStackは、ClickHouseのパフォーマンスを基盤とした、エージェント型オブザーバビリティのためのオープンな基盤をチームに提供します。数分でManaged ClickStackを始められ、$300分の無料クレジットを受け取れます。

オブザーバビリティの未来は、特定ベンダーのAI エージェントによってもたらされるものではありません。各チームが構築する何千ものエージェントによって築かれていくのです。

AIエージェントがオブザーバビリティの新しいインターフェースになりつつある

AIはオブザーバビリティのワークロードの形を変える

「偉大なるSREエージェント」に賭ける業界

デバッグの難しさ:コンテキスト

すべてのチームは異なる働き方をしている

エージェント型オブザーバビリティのためのよりオープンなモデル

エージェントには共有コンテキストが必要

人間は依然としてコントロールプレーンであり続ける

Managed ClickStack を今すぐ始めよう

Subscribe to our newsletter

最近の記事

ClickHouseがNotion Custom Agentsのネイティブ接続に対応

Managed ClickStack MCP Serverのご紹介

なぜ誰もがリアルタイム分析について語っているのか(「あの黄色い会社」からのメモ)

ClickHouse Cloud で Postgres から Postgres への ClickPipes を発表

オブザーバビリティの未来は、特定ベンダーのAI エージェントによってもたらされるものではありません。各チームが構築する何千ものエージェントによって築かれていくのです。

AIエージェントがオブザーバビリティの新しいインターフェースになりつつある #

AIはオブザーバビリティのワークロードの形を変える #

「偉大なるSREエージェント」に賭ける業界 #

デバッグの難しさ:コンテキスト #

すべてのチームは異なる働き方をしている #

エージェント型オブザーバビリティのためのよりオープンなモデル #

エージェントには共有コンテキストが必要 #

人間は依然としてコントロールプレーンであり続ける #

Managed ClickStack を今すぐ始めよう

Subscribe to our newsletter

最近の記事

ClickHouseがNotion Custom Agentsのネイティブ接続に対応

Managed ClickStack MCP Serverのご紹介

なぜ誰もがリアルタイム分析について語っているのか(「あの黄色い会社」からのメモ)

ClickHouse Cloud で Postgres から Postgres への ClickPipes を発表

AIエージェントがオブザーバビリティの新しいインターフェースになりつつある

AIはオブザーバビリティのワークロードの形を変える

「偉大なるSREエージェント」に賭ける業界

デバッグの難しさ:コンテキスト

すべてのチームは異なる働き方をしている

エージェント型オブザーバビリティのためのよりオープンなモデル

エージェントには共有コンテキストが必要

人間は依然としてコントロールプレーンであり続ける