システムの稼働時間はビジネスのペースを決定します。重要なサービスに障害が発生すると、時間は常に動き続け、遅延が一つ一つ積み重なるごとに影響は大きくなります。
現代の監視ツールは数秒で問題を報告できますが、 検出は解決ではない障害が長引く間、チームはダッシュボード、ランブック、チャットスレッドを必死にチェックしなければなりません。アラートが出ても対応が伴わないのは、単なるノイズに過ぎません。
これが実行ギャップ、つまり問題を認識してから実際に解決するまでのコストのかかるタイムラグです。ITOpsチームは、15分で解決するのと90分で解決するのとでは、時間だけでなく、数万ドルの収益、SLAの未達、そして顧客の信頼の永久的な喪失にもつながることを理解しています。
エドウィン AI 実行ギャップを埋める基本的な監視ツールはアラートを表示するだけに留まりますが、私たちは過去 1 年間、根本的に異なるものを構築してきました。 エージェントAIOps 検出する 事件を解決します。
今、私たちは限界をさらに押し広げています。 Edwin AIの専門エージェントスイートをご紹介します実稼働環境では速度がすべてを変えることを知っている ITOps チーム向けに特別に構築されています。
TL;DR: LogicMonitor は、Edwin AI の次の進化形として、IT 運用における実行ギャップを埋める専門エージェントのオーケストレーションされたエコシステムを導入します。
-
モニタリングにより問題があることがわかり、可観測性によりその理由がわかり、Edwin AI のエージェントがそれを修正します。
-
従来のインシデント対応は検出時に停止し、チームはツールやサイロを駆け巡ることになります。
-
Edwin AI は、数秒で調査、相関、推奨、修復を行う 10 以上の専用エージェントを使用して実行ギャップを解消します。
-
その結果、MTTR が速くなり、エスカレーションが減り、IT チームは新たな規模で運用できるようになります。
従来のインシデント対応の限界
まず、ほとんどの人が インシデント対応 今日では何が機能し、多くの高度なツールが依然として不十分である理由について説明します。
優れたITOps組織でさえ、時代遅れの運用モデルに囚われたままです。インシデント対応は依然としてリレー方式で行われています。あるツールが問題を検出し、別のツールが分析を行い、その後「修正」のバトンがチーム、ツール、タイムゾーンを越えて渡されるという状況です。
数字が物語っています。ほとんどのチームが 文書化されたプロセスと自動化インシデントは依然として長期化し、ダウンタイムとコストの増加を招いています。従来の監視手法は検知と相関分析には優れているものの、最も重要な「実行」の瞬間にチームを置き去りにしてしまうからです。その結果、運用上の軋轢が予測可能なパターンを呈しています。
- ランブックハンティング: システムがダウンしている間、エンジニアはプレッシャーを感じながら、Wiki、ナレッジベース、共有フォルダーをくまなく調べて適切な解決手順を見つけます。
- コンテキストの切り替え: チームはダッシュボード、ITSM チケット、チャット スレッド、CLI ツールの間を必死に切り替え、時間が迫る中、運用の全体像をまとめようとしています。
- 手動修復: いわゆる「自動化」された修正でも、手動によるトリガー、人間による検証、チーム間の調整が必要となり、スピードが最も重要となる場面で遅延が発生します。
- 情報サイロ変更データ、履歴ログ、以前のインシデント解決などの重要なコンテキストが別のシステムに閉じ込められているため、一秒一秒が重要な場合に根本原因の分析が遅くなります。
この運用の断片化は、インシデント対応プロセスに組み込まれた体系的な遅延です。
- MTTI 関連するコンテキストがアラートと同時に即座に表示されないため、平均識別時間(Mean Time to Identify:MTID)が長引いてしまいます。エンジニアは、問題解決に集中する代わりに、運用状況を再構築することに時間を浪費してしまいます。
- MTTR エンドツーエンドのプロセスを調整するインテリジェント エージェントがなく、切断されたツールやチーム間での調整が必要な修正の場合、平均解決時間 (Mean Time to Resolve) が低下します。
- 組織的知識 成功した修正が、同様の状況が発生したときにシステムによって積極的に表面化されるのではなく、個々のメモリまたは散在したドキュメント内に存在する場合、修正は消えてしまいます。
「アラート検出」から「問題解決」までの道筋は根本的に断絶したままであり、それを自動的に閉じる方法はありませんでした。
エージェント AIOps が IT インシデント対応を自動化する方法について詳しく説明します。
AIエージェントが解決策となる理由
この実行ギャップを埋めるには、現代の本番環境のスピード、規模、精度で動作できるシステムが必要です。コパイロットやチャットボットは支援はできますが、プロンプトを待ってから実行に移すという欠点があります。 AIエージェント それぞれ異なります。インシデントの状況に留まり、他のエージェントと情報を共有し、人間による指示なしに行動します。
AIエージェントは以下を提供します:
- 継続的なコンテキスト認識: エージェントは、ヘルプを依頼されるたびにゼロから作業を開始するわけではありません。インシデントの履歴、関連するメトリック、ログ、変更内容はすでに把握しています。
- 協調的な問題解決: エージェントは互いに委任することができます。例えば、あるエージェントがメトリクスを取得している間に、別のエージェントが関連する変更を探し、さらに別のエージェントが修正を推奨するといったことが可能です。
- 実行: エージェントは自動化を実行したり、問題のあるデプロイをロールバックしたり、サービスを再起動したりすることができます。
- 周囲温度での動作: エージェントはユーザーが要求する前に行動し、早期のシグナルを検出して診断や軽減策を開始します。
これらの機能を組み合わせることで、エージェントは受動的なヘルパーから、能動的で調整された労働力へと変化し、検出から解決までの経路が短縮されます。
Edwin AIのエージェントエコシステムの紹介:複雑な環境に特化したスキル
このリリースにより、Edwin AIは単一の自律型IT運用エージェントから 専門AIエージェントのエコシステムそれぞれがインシデントライフサイクルの特定の段階をマスターするように設計されています。
これらのエージェントは連携して動作し、コンテキストを共有してアクションを調整するため、ITチームは アラート 〜へ 分解能 手動によるトリアージ、断片化されたツール、知識のサイロ化によるボトルネックはありません。
以下は、Edwin AI のすべてのエージェントの概要です。
イベントインテリジェンスエージェント
- ITOps エージェント: 自然言語で対話し、回答、調査、トリアージ、トラブルシューティング、修復をガイドします。
- インサイトエージェント: Edwin AI の洞察とアラート データに基づいたコンテキスト豊富な応答を提供します。
ITSMエージェント
- 類似事件エージェント: 過去の解決メモから学習して、診断を迅速化し、実証済みの解決策を推奨します。
- 変更記録エージェント: 現在のインシデントに関連する可能性のある最近の展開、構成の更新、またはインフラストラクチャの変更を強調表示します。
ナレッジベース(KB)エージェント
- パブリックナレッジエージェント: 公開ドキュメント、ベンダー ポータル、社内ナレッジを検索して、一致するソリューションを探します。
- プライベートナレッジエージェント: 組織の内部知識を分析し、コンテキストを切り替えることなく関連するガイダンスを表示します。
テレメトリエージェント
- メトリクスエージェント: 主要なメトリックをリアルタイムで表示し、パターンや通常の動作からの逸脱を検出し、パフォーマンスの分析を可能にします。
- ログ異常エージェント: アラートに関連する異常なログ エントリを自動的に識別し、根本原因をより迅速に特定できるようにします。
オンコールエージェント
- オンコールエージェント: Slack、Teams、PagerDuty からの過去のコラボレーション スレッドとインシデントのエスカレーションを活用して、コンテキスト ガイダンス、推奨アクション、SME ルーティングを提供します。
- チャットエージェント: Slack および Microsoft Teams から直接 Edwin AI とやり取りする機能。
データ可視化エージェント
- チャートエージェント: インサイト、アラート、イベントなどの自然言語クエリから、Edwin データの視覚化を生成します。
自動化エージェント
- 自動化エージェントを生成する: インシデントを修復するための自動化を作成します。
- 自動化エージェントの検出と実行: 既存の自動化を識別して対応し、問題を解決します。
このエージェントエコシステムに加え、Edwin AIは、AI生成のアラートサマリー、根本原因分析、修復推奨事項といったコア機能を継続的に提供します。これらのスキルは専門エージェントを補完し、インシデント対応のあらゆる段階を確実にカバーします。
Edwin AIのエージェントの連携方法
IT運用におけるAIのほとんどはまだ 単目的あるモデルが質問に答え、別のモデルがグラフを描画し、別のモデルが自動化を実行します。Edwin AIのエージェントは、それぞれがインシデントライフサイクルの特定の部分について深い専門知識を提供します。しかし、真の強みは連携して機能することにあります。
例を挙げると、Edwin AIの核となるのは オーケストレーターエージェント、専門のエージェントを調整する脳。
- インシデントをコンテキストとして受け取ります。
- どのエージェントをどのような順序で、どのようなパラメータで呼び出すかを決定します。
- 出力を集約し、結果を評価し、次の最適なステップを決定します。
重要なデータベース サービスからアラートが届いた場合:
- イベントインテリジェンスエージェント AI タイトル、概要、RCA を生成します。
- 変更記録エージェント そのサービスへの最近のデプロイメントをチェックします。
- メトリクスエージェント アラートに先立つ CPU および I/O スパイクを表示します。
- 自動化エージェントを生成する 変更をロールバックするためのプレイブックを作成します。
- 自動化エージェントの実行 ロールバックを自動的に実行します。
- 死後文書エージェント エンジニアがエドウィンを離れることなく、レポートをまとめます。
Edwin AI のエージェント アーキテクチャを詳しく見てみましょう。
Edwin AI: AIエージェントの実際の使用例
Edwin AI の専用エージェントはすでに、IT 運用チームがインシデントを検出、診断、解決する方法を変えています。
早期アクセス顧客から社内テストまで、結果は 1 つの明確な結果を示しています。 MTTR が短縮され、エスカレーションが減り、エンジニアは繰り返しの対処作業から解放されます。
1. 瞬時にコンテキストに基づいたトリアージ
前L1 エンジニアは、インシデント発生後最初の 15 ~ 20 分間を、散らばったダッシュボード、チケットメモ、監視アラートから何が起こったのかをつなぎ合わせることに費やします。
後Edwin AI は、AI のタイトル、概要、根本原因分析、影響分析を数秒で生成し、オンコール SRE から経営幹部まで、全員が同じ実用的なイメージを共有できる明確で自然言語の概要を提供します。
「Edwin AIエージェントはL1エンジニアにとって非常に役立ちます。トリアージの出発点を提供し、関連情報をより早く提示するのに役立ちます。最終的には、優先順位付け、エスカレーション、そして解決の迅速化に役立ちます。」 — 早期アクセス参加者
2. 根本原因の特定を迅速化
前: エンジニアは手動でログを調べ、最近の変更要求と相互参照し、内部 KB を検索します。
後: メトリクス エージェント、ログ異常エージェント、変更レコード エージェント、類似インシデント エージェントが並行して実行され、異常、最近の変更、修正履歴を数秒で相関させます。
3. あなたを見つける知識
前: 重要な修正は、Confluence、ランブック、またはベンダー ポータルに埋もれたままになっています。
後: プライベートナレッジエージェントとパブリックナレッジエージェントが、関連する解決手順を自動的に取得します。ブラウザタブを開いたり、古い回答を参照したりする必要はありません。エンジニアは、推奨事項が自身の組織内の知識や最も信頼できるベンダーのドキュメントに基づいていることを確信し、自信を持って行動できます。
前: 「日常的な」修正であっても、自動化をトリガーし、結果を検証し、チケットを更新するには人間が必要でした。
後: 自動化エージェントは適切な修正を識別し、問題のあるデプロイメントをロールバックしたり、失敗したサービスを再起動したり、既知のパッチを遅滞なく適用したりしてアクションを実行します。
5. 一貫した事後記録
前: 事後検証は急いで行われ、一貫性がなく、作業負荷のプレッシャーにより完全に省略されることもありました。
後: Post Mortem Document Agent は、インシデントの詳細、RCA、修復、タイムライン、結果を標準形式に自動的にコンパイルし、組織の記憶を保存して将来の準備を改善します。
アシスタントとしてのAIからチームメイトとしてのAIへ
AIOpsは、検出と相関関係の分析だけで終わるものではありませんでした。当初の目標は、自律的で自己修復的なITシステム、つまり、 find 問題だが 修正します これまで、テクノロジーとオーケストレーションは、それらを提供できるほど成熟していませんでした。
エージェントAIOps その約束を果たします。かつては副操縦士やチャットボットが指示を提供し、実行は人間に委ねていましたが、今ではエージェントが調査、相関分析、推奨、そして行動を行い、人間が監督と判断を行います。
これはITチームが 根本的に異なる規模で運営されている事実上、1 人のエンジニアが AI を活用した運用チーム全体の作業を監督できます。
Edwin AIはこの変化をリードしています。可観測性、イベントインテリジェンス、自動化を1つのインテリジェントシステムに統合するためにゼロから構築されたEdwinは、コンテキストを失うことなく、インシデントライフサイクルのあらゆるフェーズに専門エージェントを適用します。
Edwin AI のエージェントの実際の動作をご覧ください
次の大きな出来事は、 if、 だけど を特定いたします。迅速かつ抑制的な解決と長期にわたる停止の違いは、実行ギャップをいかに早く埋められるかにかかっています。
次のステップに進む時が来ました。 ライブデモを予約する Edwin AI のエージェント エコシステムが、アラートから解決までをいかに短時間で実現するかをご覧ください。
LogicMonitorでEdwin AIのコンテンツ戦略を率いるMargo Poda氏。エンタープライズテクノロジーとAIスタートアップの両方での経験を持つ彼女は、複雑なトピックを明確かつ関連性が高く、読む価値のあるものにすることに注力しています。特に、似たようなコンテンツが溢れている分野において、その重要性は増しています。彼女はAIを誇大宣伝するためではなく、AIが実際に何ができるのかを人々に理解してもらうためにここにいます。
免責事項: このブログで述べられている見解は著者の見解であり、LogicMonitor またはその関連会社の見解を必ずしも反映するものではありません。
© LogicMonitor 2025 | 無断複写・転載を禁じます。 | ここで言及されているすべての商標、商号、サービス マーク、およびロゴは、それぞれの会社に帰属します。