監視するほど – 監視に AIOps を使用する

監視するほど - 監視に AIOps を使用する方法

The More You Monitor のこのエピソードでは、リード セールス エンジニアの Dondy Aponte が、監視用の AIOps が大量のデータを処理して、発生する可能性のある問題に先んじて情報を提供するのにどのように役立つかを説明します。 動的しきい値、根本原因分析、自動異常検出、予測予測により、手作業を減らし、インフラストラクチャとシステムをオンラインで稼働させ続けるツールを装備できます。

ビデオ転写

The More YouMonitorのこのエピソードにご参加いただきありがとうございます。 LogicMonitor のリード セールス エンジニアである Dondy Aponte です。 今日は、AIOps と、AI が ITOps、DevOps、SRE チームに早期警告システムの形でもたらすメリットについて詳しく説明します。 また、AIOpsの早期警告システムは複雑に聞こえるかもしれませんが、実際には簡単です。

LogicMonitorのような最新の可観測性プラットフォームには、問題が発生する前に予測し、今日の最新のIT環境内でITのダウンタイムを防ぐことができるシステムを形成する一連の機能が含まれています。 これには、クラウド、オンプレミス、およびコンテナ化されたインフラストラクチャが混在しています。

AIOps早期警告システムを真に効果的にするには、次のものが含まれている必要があります。 動的なしきい値、アルゴリズムによる根本原因分析、自動化された異常検出、および予測予測。 早期警告システムの中心は、ITインフラストラクチャメトリックやログデータなどのデータセットでの異常検出をサポートするAIと機械学習アルゴリズムです。 このシステムは、大量の監視データを選別します。

テキストの正常なパフォーマンスは、技術的およびビジネス メトリックの範囲であり、異常に基づいてアラートを生成します。 これにより、表示されるアラートの量に大きな違いが生まれ、チームはアラートの疲労と表面の異常をより早く回避できます。 組織の47%が月に50,000を超えるアラートを受信することを考えると、これは重要です。 特定のデータ ポイントの予想されるパフォーマンス範囲の境界を設定する動的しきい値により、IT チームは手動の静的しきい値の管理に費やす管理オーバーヘッドの時間を節約できます。 これらは、チームが例外や最新の一時的な環境を発見するためのより効果的な方法を提供します。

自動化された根本原因分析は、AIOps早期警告システムのもうXNUMXつの重要な部分です。 根本原因分析は、トポロジ マップの関係に依存して、依存リソースに影響を与えているインシデントの根本原因を特定します。 根本原因分析により、チームは依存リソースに関連する問題を無視し、問題の根本原因の解決に集中することができます。

最後になりましたが、容量予測の予測需要により、ITOps、DevOps、および SRE チームは、システムがどこに向かっているのか、そしてどのシステムが近い将来注意を必要とするのかを予測することができます。 予測により、チームは、現在 85% のディスク使用量が実際にその値に達する前に 95% に達する時期を判断できます。 チームは、将来の問題を防ぐために今日実行する必要があるアクションがある場合、そのアクションについて決定を下すことができます。

ここまで、AIOps 早期警告システムによって可能になった機能と利点のいくつかについて説明しました。 AIOps が組織のデジタル トランスフォーメーション ジャーニーを促進する方法の詳細については、LogicMonitor の最新の AIOps 電子書籍、Comprehensive AIOps for Monitoring をダウンロードしてください。 また、AIOps ビデオ シリーズの次のセグメントにも注目してください。 私は Dondy Aponte です。LogicMonitor にサインオフします。

電子書籍をダウンロードする