よりプロアクティブな問題検出のための動的しきい値の使用

よりプロアクティブな問題検出のための動的しきい値の使用

重大な問題についてページングされ、静的なしきい値に捕らえられなかったリクエストの明らかな減少を見つけるためだけにトラブルシューティングを開始したことがありますか? または、静的しきい値を超えなかったメトリックの大幅な増加ですか? あるいは、警告アラートの証拠がずっと前にトリガーされ、誰かが問題を解決してビジネスへの影響を防ぐことができるはずでしたが、チームが受け取った大量のアラートでは無視されましたか?

LogicMonitorには、これらの問題を回避するために、すぐに使用できる包括的なアラートがすでに設定されています。 この設定では、一般的な実稼働環境で問題を発生させることを目的としたXNUMXつの重大度レベルのベストプラクティスしきい値を活用します。 動的しきい値抑制は、ノイズの多いアラートを除外することを目的としています。

メトリック異常のアラート

本日、これをさらに一歩進める動的しきい値の機能強化を発表します。 これらの機能強化により、動的しきい値はメトリック異常のアラートも生成します。これにより、上記で強調したシナリオをより迅速かつ簡単に検出できます。

動的しきい値は、異常検出アルゴリズムに依存して、履歴データに基づいてリソースのパフォーマンスの予想範囲を計算します。 この予想される範囲は、アラートを生成し、異常でないパフォーマンスに対応するアラートの通知を抑制する必要がある異常を識別するために使用されます。 これにより、適切なタイミングで適切なものに対してアラートが生成されます。

動的しきい値は、メトリック値の異常を識別するだけでなく、メトリックの変化率の異常も検出します(マシン情報の記入> という構文でなければなりません。例えば、 すぐにいっぱいになり始めるディスク)と時間ベースのパターン(季節性– マシン情報の記入> という構文でなければなりません。例えば、 通常は毎日または毎週バックアップするVM)。

開始する方法

開始は簡単で、必要な重大度の動的しきい値を有効にするだけで、期待される範囲が自動生成されます。 もちろん、LogicMonitorの他のすべてと一致して、この自動生成された範囲を適切なデフォルトで広く適用できるように努力しましたが、必要に応じて「詳細設定」でカスタマイズできます。

有効にすると、動的しきい値によって異常のアラートが生成されるので安心できます(また、異常に対応しない静的しきい値によって生成されるアラートの通知を抑制します)。

静的しきい値と互換性があります

LogicMonitorの動的しきい値のユニークな側面のXNUMXつは、静的しきい値を適切に処理できることです。 これは両方の長所です。動的しきい値は、調整が不十分であるか、まったく設定されていない静的しきい値を補正します(アラートが生成されるアラートが多すぎる場合は通知を抑制し、アラートを生成する必要があるが生成されない場合はアラートをトリガーします)。適切に設定されている静的なしきい値に従います。 この組み合わせにより、アラート条件を手動で調整するオーバーヘッドを最小限に抑えながら、チームに適切なタイミングで適切なアラートが生成されます。

LogicMonitorの他の機能と組み合わせる 早期警告システム - といった 根本原因分析 & 予報 –動的しきい値は、ビジネスに影響を与える問題をより積極的に防止するのに役立ちます。 このインテリジェンスと、インフラストラクチャからアプリケーション、ネットワーク、オンプレミスまたはクラウドでの実行まで、LogicMonitorの包括的な監視範囲を組み合わせることで、最も複雑な環境でも成功するために必要な可視性を確保できます。 LogicMonitorのAIOps早期警告システムの詳細を確認したり、実際の動作を確認したりするには、 無料トライアルにサインアップ