Kubernetes – AI を活用したログとメトリクスの相関により、カオスからインサイトへ

Kubernetes グラフィック

LogicMonitor プリンシパル クラウド スペシャリスト アカウント エグゼクティブ、John Stimmel 著

Kubernetes (一般に「K8」と呼ばれる) のコンテナ管理とオーケストレーションが、クラウドネイティブの俊敏性と優れた顧客エクスペリエンスを実現することでビジネス価値を提供することは周知の事実です。その性質上、Kubernetes プラットフォームの速度と機敏性には複雑さが伴います。俊敏性を提供するこのインフラストラクチャの一時的な作成と破棄の動作により、膨大な量のメトリクス データとログ メッセージが作成されます。大きな問題が発生した場合、これはほとんどの人間のチームにとって対処するには多すぎることがよくあります。

トラブルシューティングの悪夢

K8s ポッドが継続的に再起動しているか、Kubernetes の「クラッシュ ループ」に入っていることにチームが気づいたとしましょう。メトリクスは、ポッドがクラッシュしており、ポッドの健全性に影響を与える可能性のあるリソース停止が発生している可能性があることを示します。しかし、その原因が「バグのある」アプリケーションだった場合はどうなるでしょうか?逆に、さらに悪いことに、エンドユーザーや顧客に影響を与え、ビジネスに直接影響を与える重大なアプリケーション障害を引き起こしていませんか?問題はハードウェアに関連している可能性がありますか?要は失敗点がたくさんあるということです。

この状況では、運用チームとエンジニアは監視ツールとログ リポジトリを切り替え (または、多くの場合、別のチームにログ データを掘り出すよう依頼して待機します)、ログ メッセージを 1 行ずつ丹念に調べて、アプリケーション エラーやエラーを探します。関連情報。彼らはタイムスタンプを比較し、タイム ウィンドウとクライアント/サーバー アドレスをメトリック レポートに合わせようとしています。この徹底的なプロセスには、複数の上級エンジニア、基幹業務リソース、ディレクター、そして多くの場合経営幹部レベルを含む全員が参加する必要があります。問題の検出と修正には何時間もかかり、問題が発生するたびに収益に影響を与えます。さらに、これらの活動をチェックしないと、チームの士気に悪影響を及ぼします。

サイロ化された監視ツールの落とし穴

モノリシック アプリケーションの昔は、サイロ化された監視ツールから別の監視ツールに移行してイベント、ログ、メトリクスを分析し、サービスの問題の根本原因を見つけることが非常に困難でした*。現在、サイロ化された監視ツールのアプローチにより、動的で一時的で機能がはるかに複雑な最新のクラウドネイティブ アプリケーションでは、真の可観測性を実現することがほぼ不可能になっています。

LogicMonitor のエンドツーエンド ソリューション

LogicMonitor の LM Envision プラットフォームは、階層化されたインテリジェンスを利用して、クラウド、K8、コンテナのメトリクス、ログ、トレース、イベントを統合されたビューとワークフローで監視します。運用チームは、K8s 障害が発生したことを認識し、それがアプリケーションまたはネットワークのインフラストラクチャ障害の影響を受けているかどうかを、特定のエラー メッセージに至るまで知ることができます。この情報は簡潔なメッセージで相互に関連付けることができるため、チームは「何を」と「なぜ」を知ることができます。

検出、調査、解決にかかる平均時間を短縮する

LogicMonitor の統合プラットフォームを使用すると、チームは問題の解決をすぐに開始できるため、問題の平均検出時間 (MTTD)、平均調査時間 (MTTI)、および平均解決時間 (MTTR) が大幅に短縮されます。問題はわずか数分で切り分けられるため、クラウド チームと運用チームは、統合された関連性の高い傾向データにアクセスして予測と分析を支援しながら、すぐに問題の解決に取り組むことができるため、事後対応からプロアクティブかつ予測的な対応に移行することができます。

事後対応型からプロアクティブかつ予測型へ

AI を活用した LogicMonitor のハイブリッド オブザーバビリティにより、チームは消火モードからより戦略的で先進的なアプローチに移行できるようになります。 AI 主導の洞察と統合された可観測性を活用することで、組織は問題をより迅速に解決し、潜在的な問題がビジネスに影響を与える前に予測して防止することができます。このプロアクティブかつ予測的なアプローチは、今日のペースの速いクラウドネイティブの世界で顧客が期待するシームレスなデジタル エクスペリエンスを提供するために不可欠です。