根本原因分析と自動修復への道

インフラストラクチャ内の問題や障害のために深夜にページングされることを望んでいる人は誰もいません。 これが発生した場合、IT運用エンジニアは、火災がどこにあるのか、そして悪影響を最小限に抑えるためにどのように消火するのかを迅速かつ自信を持って特定できる必要があります。 ザ・ 根本原因分析 LogicMonitorの新機能内の(RCA)機能 AIOps早期警告システム これがこれまで以上に簡単になります。 RCAは、問題が発生したときに根本原因をインテリジェントに特定し、IT運用エンジニアが問題を検索するのではなく迅速に解決することに集中できるようにします。 LogicMonitorのほとんどすべてを監視する機能を備えています(マシン情報の記入> という構文でなければなりません。例えば、 クラウド、コンテナ、ネットワーク、サーバー、ストレージ、仮想化など)、これは、RCAが複雑なハイブリッドインフラストラクチャの場合でもダウンタイムを削減できることを意味します。 

RCAは自動的に検出されたものを使用します トポロジー 監視対象リソース間の関係。これらのリソース間の依存関係を確立します。 監視対象のリソースが到達不能になると、それらの依存関係を使用して、根本原因と影響を受ける依存リソースを特定します。 IT運用エンジニアにルーティングされるアラート通知は根本原因の通知に限定され、影響を受ける依存リソースに関する情報が含まれるため、これらのエンジニアがこのようなシナリオで通常受信する典型的なアラートストームを防ぎます。 RCAは、根本原因を曖昧にするアラートストームを防止することにより、問題の解決までの時間を短縮し、ダウンタイムを最小限に抑えるのに役立ちます。 

LogicMonitorプラットフォーム内に影響を受ける多数の依存デバイスがある到達不能な親デバイスのトポロジビュー。
LogicMonitorプラットフォーム内に影響を受ける多数の依存デバイスがある到達不能な親デバイスのトポロジビュー。

通常、これにより、到達不能なすべてのデバイスに対して数十のアラートが発生しますが、RCAを使用すると、発生原因アラートが識別され、依存アラートがグループ化され、依存者のアラート通知が無効になります。

LogicMonitorの根本原因分析を使用すると、発生した原因アラートが識別され、依存するアラートがグループ化されます。 扶養家族のアラート通知は無効になっています。
元の原因アラートが識別され、依存アラートがグループ化され、依存者のアラート通知が無効になります。

最初のリリースは監視対象リソースの到達可能性に依存していますが、将来の機能拡張により、LogicMonitorが提供するデフォルトを超えてリソースの依存関係をよりきめ細かく構成できるようになります。 

では、RCAは自動修復と何の関係があるのでしょうか。 根本原因の特定はほんの始まりに過ぎません。 根本原因の問題を修正するアクションを自動化する機能を提供したいと考えています。 これにより、問題をインテリジェントに特定して予測することから、問題を自動的に修正して防止することまでのループが閉じられ、ダウンタイムがさらに削減されるだけでなく、IT運用チームの貴重な時間が節約され、イノベーションにより多くの時間を費やし、問題への対応にかかる時間を短縮できます。 RCAはこの方向への一歩に過ぎませんが、この最初のステップで、私たちは騒音をカットし、中断のない睡眠のより多くの夜を提供することを目指しています。 LogicMonitorチームに詳細を問い合わせるか、無料トライアルを開始してください。