クラスターアラート

最終更新日: 12 年 2021 月 XNUMX 日

概要

クラスターアラートは、リソースグループ内の複数のリソースにわたるデータポイントを監視およびアラートします。 これらは、デバイスまたはクラウドリソースのコレクションの全体的な状態をすばやく把握できるように設計されています。 たとえば、これは、アプリケーションにサービスを提供している、またはタスクを実行しているリソースのプールがある場合に役立ちます。 プール内の単一のリソースに影響を与える問題についてはあまり気にしないかもしれませんが、リソースのプール全体がその目的を果たせなくなるリスクがあるかどうかをすぐに知りたいと思うでしょう。 このような場合、80つのバッチサーバーのCPU使用率がXNUMX%を超えるとトリガーされるようにクラスターアラートを構成できます。

クラスターアラートは、同じリソースグループに属するデバイスまたはインスタンスの個々のアラートの存在に基づいてトリガーされます。 たとえば、前の段落で提供されたシナリオを使用すると、グループ内の80つのバッチサーバーでCPU使用率のアラートしきい値としてXNUMX%を設定し、クラスターアラートをトリガーするためにそのしきい値を超える必要があります。 クラスターアラートは個々のデータポイントアラートに依存しているため、で説明されているように、データポイントのしきい値を調整しておくことが重要です。 データポイントの静的しきい値の調整.

注: クラスターアラートは、リソースグループの全体的な状態を測定する簡単な方法です。 リソースのグループ全体にわたるより高度な監視およびアラート機能については、LM Service Insightを検討してください。これは、XNUMXつ以上の監視対象リソース(デバイスなど)全体のインスタンスを論理的な「サービス」にグループ化する機能です。 詳細については、を参照してください。 LM ServiceInsightについて.

クラスターアラートの構成

クラスターアラートは、[リソース]ページから構成されます。 リソースツリーから、 リソースグループ クラスターアラートを構成している対象であり、グループの詳細ビューから、[クラスターアラート]タブを開きます。 右上隅にある追加アイコン(プラス記号+)をクリックして、[クラスターアラートの追加]ダイアログを開きます。 次に説明するように、構成する必要のあるフィールドがいくつかあります。

[クラスターアラートの追加]ダイアログ

クラスターアラートをトリガーするために必要な個々のデバイス/インスタンスアラートレベル

ノーザンダイバー社の 少なくとも次のような場合にクラスターアラートをトリガーします フィールドのドロップダウンメニューで、個々のデバイス/インスタンスがクラスターアラートをトリガーするために必要なデバイス/インスタンスの総数に貢献するために必要な最小アラート重大度レベルを選択します。

クラスターアラートをトリガーするために必要なアラートレベルを満たす必要があるデバイス/インスタンスの数

前のフィールドで指定されたアラート重大度レベルを満たす必要があるデバイスまたはインスタンスの数または割合を指定するには、合計XNUMXつのフィールドを構成する必要があります。

  • 比較演算子。 総数またはパーセンテージに適用される比較演算子を選択します(たとえば、提供された総数よりも大きい)。
  • しきい値。 で指定されたアラート重大度レベルを満たす必要があるデバイスグループ内のデバイスの数またはパーセンテージを入力します。 少なくとも次のような場合にクラスターアラートをトリガーします フィールド。 データポイントのしきい値と同様に、次に示すように、アラートレベルごとに数値を入力できます。

    クラスターアラートの複数のアラート重大度レベルの構成
    ここに示す例では、グループ内の5つのデバイスにCPUBusyPercentデータポイントの重大度エラーのアクティブアラートがある場合、重大度レベルの警告のクラスターアラートが生成されます。 グループ内の6つのデバイスに重大度エラーのアクティブアラートがある場合、重大度エラーのクラスターアラートが生成されます。 グループ内の7つ以上のデバイスに、重大度がエラーのアクティブなアラートがある場合、重大度がクリティカルのクラスターアラートが生成されます。

  • 総数またはパーセンテージ。 ドロップダウンメニューから「合計」を選択して、しきい値が静的デバイスまたはインスタンス数であることを示します。 「パーセント」を選択して、しきい値がグループ内のデバイスまたはインスタンスの総数のパーセンテージであることを示します。
  • デバイスまたはインスタンス。 ドロップダウンメニューから、アラートのデバイス数またはインスタンス数のどちらを使用してしきい値カウントまたはパーセンテージを計算するかを指定します。

データソースとデータポイント

[データソース]フィールドと[データポイント]フィールドのドロップダウンメニューから、しきい値が評価されるデータポイント(およびそれを所有するデータソース)を選択して、で指定された最小アラート重大度レベルを満たしているかどうかを確認します。 少なくとも次のような場合にクラスターアラートをトリガーします フィールド。

クラスターアラートの管理

クラスターアラートを構成して保存すると、[クラスターアラート]タブのテーブルに表示されます。 このテーブルから、(管理アイコンを使用して)クラスターアラートの構成を編集したり、グループのメンバーの個々のデータポイントアラートを有効/無効にしたり、クラスターアラート自体を無効/有効にしたりできます。

データポイントアラートの有効化

LogicMonitorは、クラスターアラートがグループ内のリソースの個々のデータポイントアラートに優先することを前提としています(つまり、リソースのコレクションの全体的な状態は意味のあるメトリックであり、リソースの個々の状態ではありません)。 このため、クラスターアラートを構成して保存すると、指定されたデータポイントの個々のデータポイントアラート通知は、デフォルトでグループのメンバーに対してオフになります。 これらのアラートは引き続きインターフェース(つまり、[アラート]ページまたは[アラート]タブ)に表示されますが、アラートのアラート通知はルーティングされません。

グループの個々のメンバーのデータポイントアラートを有効にする

個々のデータポイントアラート通知を再度有効にするには、 データポイントアラートを有効にする ClusterAlertsテーブルにあるオプション。 オンにすると、グループメンバーの個々のデータポイントアラート通知がクラスターアラート通知とともにルーティングされます。

クラスターアラートの無効化

チェックをはずす 有効にします クラスターアラートを無効にするオプション。 無効にすると、クラスターアラートはアラートを生成しなくなります。

ルーティングクラスターアラート通知

すべてのアラートと同様に、クラスターアラートは[アラート]ページと[アラート]タブ([リソース]ページから利用可能)に表示されます。 「クラスター」のデバイス名は、常にクラスターアラートに割り当てられます。 この一般的なデバイス名は、アラートルーティング、フィルター、またはレポート基準を指定するときに使用できます。

さらに、クラスターアラートの通知を生成してルーティングする場合は、アラートルールを構成する必要があります。 少なくとも、このアラートルールの基準は、クラスターアラートが構成されているグループと一致する必要があります。 クラスターアラートをグループの他のアラートとは異なる方法でルーティングする場合は、アラートルールを「クラスター」デバイスに一致するように設定することで、より詳細なレベルの一致を実現できます。 アラートルールの詳細については、を参照してください。 アラートルール.

クラスターアラートをルーティングするためのアラートルールの構成
ここにリストされている最初のアラートルールは、「オンコールIT」エスカレーションチェーンにとって重要な重大度レベルのすべてのクラスターアラートのアラート通知をルーティングします。 XNUMX番目のアラートは、リソースグループで発生する重大度レベルのエラーの問題(重大度以外の重大度のクラスターアラートを含む)のアラート通知をルーティングします。

注: クラスターアラートのアラート通知ルーティングをテストするには、[クラスターアラート]タブにあるアラートルーティングアイコンをクリックします。 クラスターアラートのアラート通知ルーティングをテストするプロセスは、特定のデータポイント/インスタンスペアのアラート通知ルーティングをテストするプロセスと同じです。 見る アラート配信のテスト のガイドをご参照ください。

記事上で