動的しきい値を使用してノイズを排除し、重要なことに焦点を当てる

動的しきい値を使用してノイズを排除し、重要なことに焦点を当てる

ほとんどの人がモニタリングの文脈で「動的しきい値」を聞くとき、彼らは アラートをトリガーする 非静的しきい値に基づいています。 これは非常に便利ですが、実際には全体像の半分にすぎません。 

最新のITインフラストラクチャは複雑であり(多くの場合、クラウド環境とオンプレミス環境にまたがるインフラストラクチャがあります)、IT運用チームはこれらの環境のデータとアラートノイズで溢れています。 彼らは意味のある使用ができるよりも多くの情報を持っているため、問題がノイズで不明瞭になり、IT運用チームは問題への対応にほとんどの時間を費やしています。 これを修正し、代わりに問題の防止に取り組むために、これらのチームは、ノイズをカットし、最も重要な情報を明らかにするための何かを必要としています。 ここLogicMonitorでは、これを達成するために動的しきい値が解決する必要があるXNUMXつの主要な側面があると考えています。

  1. しきい値が適切に調整されていないために発生するノイズをカットし、重要な問題を明らかにします。
  2. 従来の静的しきい値では検出されない問題を特定します。

これが、アラートのトリガーが動的しきい値の全体像の半分にすぎず、残りの半分が動的しきい値をフィルターとして使用していると私たちが信じている理由です。 アラートを減らす すぐに関連するものだけに。

LogicMonitorの動的しきい値はカバーします 両言語で 上記で特定された機能。フェーズXNUMXの最初の機能から始まります。 LogicMonitorには、ドメイン固有のベストプラクティスに基づいて事前構成されたしきい値がすでに設定されており、意味のあるアラートがすぐにトリガーされるようになっています。 動的しきい値の最初のフェーズでは、LogicMonitorは、リソースのパフォーマンスの予想範囲を計算し、この範囲外の値に対応するトリガーされたアラートの通知のみを送信することで、これをさらに一歩進めます。これにより、アラートが送信されるのは次の場合のみになります。異常。そのチームは、問題に本当に注意が必要な場合にのみ通知を受け取ります。

LogicMonitorプラットフォーム内でのメモリ使用量の表示とアラートしきい値の設定


大規模な環境の静的しきい値を正確かつ具体的に調整するには、特にリソースの使用方法が異なる場合、多くの管理オーバーヘッドが必要になる可能性があります(
すなわち 意図的に利用されているものとそうでないものがあります)。 LogicMonitorの動的しきい値のこの最初のフェーズでは、動的な予想範囲を使用してアラートをルーティングするかどうかを決定するため、IT運用チームは静的しきい値をカスタマイズする時間を節約できます。 範囲内のアラートは引き続きLogicMonitor内に表示されますが、ユーザーには通知されません。 この機能により、LogicMonitorは、意図的に使用率の高いリソースの「通常の」リソース消費を自動的に識別し、通常ではない消費についてのみユーザーに通知します。

エラーと警告、関連するLogicModule、およびしきい値を示すLogicMonitorアラート。


LogicMonitorの幅広いカバレッジ。クラウドから従来のオンプレミス環境にあるシステムまで、2000を超えるすぐに使用できるモニタリングテンプレートがすべてをカバーします(
マシン情報の記入> という構文でなければなりません。例えば、 サーバ、スイッチ、ストレージアレイなど)から コンテナ それらの中で実行することにより、動的なしきい値を最新の分散ITインフラストラクチャ全体に適用できます。 そのため、LogicMonitorの動的しきい値の最初のフェーズは、IT運用チームに、複雑なインフラストラクチャのノイズを排除し、ビジネスを前進させるために重要なことに集中する簡単な方法を提供します。