LogicMonitor + Catchpoint: 自律型ITの新時代へ

さらに詳しく

LogicMonitor Collectorは、監視システムの心臓部です。 そのため、コレクターを監視して、パフォーマンスがデータ収集の負荷に追いついていることを確認することが重要です。 同様に重要なのは、コレクターがダウンしたときに可能な限り混乱を最小限に抑えることです。 これには、タイムリーな通知が適切な受信者に配信されるようにすることが含まれます。

ベストプラクティスとして、LogicMonitorでは、(1)コレクターの監視を設定し、(2)コレクターのダウンアラートの通知ルーティングを構成することをお勧めします。

コレクタホストのモニタリングへの追加

監視対象にまだ追加されていない場合は、コレクターがインストールされているデバイスを監視対象に追加してください。これにより、CPU使用率、ディスク容量、その他コレクターのスムーズな動作に重要な指標を監視できるようになります。デバイスを監視対象に追加する方法の詳細については、以下をご覧ください。 リソースの追加.

ホストでのコレクターデータソースの有効化

LogicMonitorは、コレクターの操作、パフォーマンス、およびワークロードに関する洞察を提供する一連の組み込みコレクターデータソースを提供します。 ほとんどの場合、これらのコレクターデータソースは、モニターに追加すると、コレクターデバイスに自動的に適用されます。 リソースツリーでデバイスを展開し、「コレクター」データソースグループを探すことで、これが当てはまることを確認できます。

リソースツリーでデバイスを展開し、「コレクター」データソースグループを探すことにより、コレクターデータソースがコレクターデバイスに適用されていることを確認します

コレクターデータソースがデバイスに自動的に適用されなかった場合は、「コレクター」の値をデバイスに追加することにより、手動で適用できます。 システム カテゴリ プロパティ。 プロパティの設定の詳細については、を参照してください。 リソースとインスタンスのプロパティ.

LogicMonitorは、このデバイスをコレクターのホストとしてインデックス付けし、コレクターデータソースを自動的に適用します。 コレクターデータソースを配置したら、コレクターのパフォーマンスが不足している場合に警告するアラートを構成できます。

注意: コレクターデータソースは、(デバイスの構成で確立された)デバイスの優先コレクターのみを監視します。 優先コレクターは、そのデバイスにインストールされているコレクターである必要があります。 そうしないと、コレクターのメトリックが間違ったホストに表示されます。 たとえば、コレクターB(別のホストにインストールされている)を使用してコレクターAをモニターしようとすると、コレクターAのホスト上のコレクターAの代わりにコレクターBのメトリックが表示されます。

コレクターデータソース

レガシーデータソースからの移行

2019年XNUMX月、LogicMonitorは新しいコレクタデータソースのセットをリリースしました。 現在、従来のデータソースを使用してコレクターホストを監視している場合、このパッケージに新しいデータソースをインポートしてもデータが失われることはありません。 これは、モジュールの上書きを排除するためにデータソース名が変更されたためです。

ただし、データソースの両方のセットがアクティブである限り、重複データを収集し、重複アラートを受信します。 このため、従来のコレクタデータソースを無効にすることをお勧めします。 従来のデータソースは、名前の前に「LogicMonitor_Collector」が付いていないコレクターデータソースです。 プレフィックスが「LogicMonitor_Collector」の場合、それは現在のコレクターデータソースです。

データソースを無効にすると、ホストへのクエリとアラートの生成が停止しますが、すべての履歴データは保持されます。 ある時点で、レガシーデータソースを完全に削除したい場合がありますが、削除するとすべての履歴データが失われるため、この移動を慎重に検討してください。 データソースの無効化の詳細については、を参照してください。 データソースまたはインスタンスの監視を無効にする.

データソースの例のハイライト:コレクターデータ収集タスク

適用されるコレクターデータソースの10つは、「コレクターデータ収集タスク」データソースです。 収集時間、実行時間、成功/失敗率、およびアクティブな収集タスクの数に関する統計を監視します。 このデータソースで使用できる概要グラフのXNUMXつは、コレクターの負荷に寄与する上位XNUMXのタスクを特徴としており、CPUまたはメモリの使用量の原因を特定するのに非常に役立ちます。

トップ10の収集タスクの概要グラフは、CPUまたはメモリの使用量の原因を特定するのに非常に役立ちます

コレクターダウンアラートのルーティング

LogicMonitorのサーバーが3分間コレクターからの通信を受信できない場合、コレクターはダウンしたと宣言されます。コレクターがダウンした場合に備えてバックアップコレクターを用意しておくことは多いでしょうが、コレクターが予期せずオフラインになる状況は避けるべきです。詳細については、以下をご覧ください。 コレクターのフェイルオーバーとフェイルバック.

ダウンタイムを最小限に抑え、監視中断のリスクを軽減するには、「コレクターダウン」アラートが組織内の適切な担当者に(メール、テキストメッセージなどで)確実に配信されるようにしてください。(これらのアラートはLogicMonitorインターフェースにも表示されます。)

重要: コレクターがダウンしていると宣言されると、コレクターがダウンする前にそのコレクターによって監視されているデバイスによってトリガーされたアラートはアクティブなままですが、コレクターがダウンしている間は新しいアラートは生成されません。 ただし、別のコレクターにフェイルオーバーしないデバイスは、アラート生成の抑制を無視し、コレクターのステータスがダウンしているときにホストステータスアラートを生成する場合があります。

コレクターのダウンアラートをルーティングするには、コレクターの構成を開きます(設定 > コレクタ > 管理 )そして以下を指定します:

  • コレクターダウンエスカレーションチェーン—エスカレーションチェーンは、アラートを通知する必要がある人またはグループ、通知方法、通知順序を指定します。詳細については、 エスカレーションチェーン.
  • 再送信間隔-から コレクターダウン通知を送信する フィールドで、コレクターダウン通知の再送信間隔を設定します。 再送信しないことを示す(つまり、通知はXNUMX回だけ送信される)か、コレクターのダウンアラート通知がエスカレーションチェーンの次のステージにエスカレーションされるまでに経過する必要がある時間を示すことができます。 アラートが最終段階に達した場合、またはエスカレーションチェーンで指定された段階がXNUMXつしかない場合、この間隔が設定されると、確認またはクリアされるまでアラート通知が再送信される頻度が決まります。

注意: デフォルトでは、ダウンしたコレクターがオンラインに戻ると、「アラートクリア」通知がすべてのエスカレーションチェーン受信者に自動的に配信されます。 コレクターの詳細を展開し、チェックを外すことで、このデフォルトをオーバーライドできます。 クリアに関するアラート 次に示すオプション。 ただし、コレクタの指定されたエスカレーション チェーンがアラート通知を LM 統合にルーティングする場合は、このオプションを無効にしないことをお勧めします。 詳細については、次を参照してください。 アラートルール の三脚と エスカレーションチェーン.

14日間フルアクセス LogicMonitor プラットフォーム