LogicMonitor は、2024 Gartner Voice of the Customer の Observability プラットフォーム部門で、Gartner Peer Insights™ の Customers' Choice に選出されました。

続きを読む

実務教育

MSP が AI を活用した可観測性で MTTR とクラウド コストを削減する方法

午前 3 時の恐ろしい電話、矛盾するステータスインジケーターを示す複数の監視ツール、問題を解決する代わりに責任をなすりつけるチームなど、IT 運用の専門家なら誰でもよく知っている光景です。数百または数千の顧客をサポートするマネージドサービスプロバイダー (MSP) にとって、この課題は飛躍的に増大します。しかし、AWS re:Invent 2024 で、Synoptek のチームは、AI を活用した可観測性を通じて、1,200 を超える顧客ベースのこの現実を根本的に変革した方法を明らかにしました。

主要な取り組み

チェックマーク
ツールの無秩序な増加により、従業員のシフト全体にわたる専門スタッフの要件や継続的なトレーニングの必要性など、ライセンス以外の隠れたコストが発生します。統合された可観測性プラットフォームは、これらの非効率性を排除し、可視性を向上させます。
チェックマーク
包括的な監視とリソース消費の最適化により、クラウド コストを 20% 削減できます。ほとんどの組織は「安全のため」にリソースを過剰にプロビジョニングしますが、リアルタイムの監視と使用率分析により、自信を持って適切なサイズを決定できます。
チェックマーク
AI により、レベル 1 エンジニアの役割を進化させることができます。日常的な監視タスクを削減することで、エンジニアは DevOps 運用などの分野でより価値の高い作業に移行し、より良いキャリア パスを作成しながらサービス提供を改善できます。
チェックマーク
複雑な構成やルール エンジンを使用せずに、AI を活用した分析によってアラート ノイズを 80% 削減できます。これは、フィルタリングを向上させることではなく、通常の動作パターンを理解するインテリジェントな分析です。

ツールの無秩序な増加の本当のコスト: ツールが増えると問題も増える

「以前は、当社のエンタープライズ オペレーション センターは、アラートや異常を探すために 6 つの異なるツールを監視していました」と、Synoptek のシステム統合エンジニアである Mike Hashemi 氏は語ります。

この認識は、複数の異なるツールを使って運用することが、苦痛ではあっても、受け入れられている標準となっている世界中の MSP に共感を呼びました。

このアプローチの本当のコストは、単純なツール ライセンスをはるかに超えます。Synoptek のクラウド オペレーション担当ディレクター、Neetin Pandya 氏は、運用上の負担の厳しい状況を次のように説明しています。「顧客が 1,000 人以上いる場合は、同じスキル セットを持つエンジニアを 1 人か 2 人、異なるシフトで配置する必要があります。つまり、1 つのツールに対してエンジニアが常に 3 人必要になるのです。」3 つのシフトに専門スタッフを分散させると、財務的にも実用的にも持続不可能な運用モデルが生まれます。

複雑さは人員配置だけにとどまりません。各監視ツールには、独自のトレーニング要件、メンテナンスのオーバーヘッド、統合の課題が伴います。

一例として、異なるツールが同じデバイスに対して矛盾するステータスを表示する場合、エンジニアは実際の問題を解決するのではなく、アラートが本物かどうかを確認するだけで貴重な時間を無駄にします。このツールの無秩序な増加により、応答時間の増加、サービス品質の低下、顧客の不満という最悪の事態が発生します。

伝統的な制約からの解放

Synoptek の変革は、監視アプローチの根本的な転換から始まりました。複数のエージェントベースのツールを管理するのではなく、場所や接続方法に関係なく、データを生成するあらゆるものを監視できるエージェントレス アーキテクチャに移行しました。

ハシェミ氏は、次のような印象的な例を挙げています。「ネットワークに接続されていないデバイスがありました。しかし、それはシリアル ケーブル経由で Raspberry Pi に接続されていました。彼らは、それを監視システムとは別に監視する必要があることに気付きました。そして彼らは、「これをそこに入れても大丈夫ですか?」と言いました。私は、「はい、もちろん、問題ありません」と答えました。」

AI プラットフォーム LM Envision を搭載した LogicMonitor のハイブリッド可観測性によるこの柔軟性は、多様なクライアント環境と独自の監視要件をサポートする必要がある MSP にとって非常に重要です。しかし、本当のブレークスルーは、動的しきい値と AI を活用した分析の実装によってもたらされました。

従来の静的しきい値は、理解しやすいものの、誤検知が絶えず発生し、運用チームを圧倒します。「サーバーの CPU が 1 分間急上昇し、その後急降下した場合、それはクラスター内の 1 つの CPU です。アラートは表示されますが、誰が気にするでしょうか。クラスターは正常でした」と Hashemi 氏は説明します。通常の動作パターンを理解する動的しきい値への移行により、このノイズは大幅に減少しました。

コスト最適化のブレークスルー

おそらく、Synoptek の変革で最も魅力的な側面は、クラウド コストの最適化という予想外の領域で現れました。Pandya 氏は、多くの組織を悩ませている一般的なシナリオを次のように説明しています。「安全のために、彼らはサイズを 2 倍にして、その時点で配置して展開するだけです。しかし、彼らはそれを知らず、毎月の継続的なコストを大量に負担しています。」

Synoptek は、リソース使用パターンの包括的な監視と分析を通じて、クライアントがクラウド コストを平均 20% 削減できるよう支援してきました。これは、十分に活用されていないリソースを特定することだけではなく、時間の経過に伴う使用パターンを理解し、リソース割り当てについてデータに基づいた決定を下すことも意味します。

AI革命: チームを置き換えるのではなく、チームに力を与える

AI を活用した運用の実装は、Synoptek のサービス提供方法に根本的な変化をもたらし、初期の兆候ではアラート ノイズが少なくとも 80% 削減されることが示されています。しかし、アラートの量が劇的に減少すると、レベル 1 エンジニアはどうなるのでしょうか。Synoptek は進化の機会を見出しました。

「継続的な監視を担当する L1 エンジニアは、もはや必要ありません。彼らをより積極的な、またはビジネス戦略的な仕事、特に DevOps 運用サポートに投入します」と Pandya 氏は説明します。この変革は、MSP にとって、従業員の満足度と定着率を向上させながら、サービス提供を向上させる重要な機会となります。

マネージドサービスプロバイダーの新時代

Pandya 氏は次のように結論づけています。「最大の利点は、クラウド プラットフォームを監視できるだけでなく、すべてのハイパースケール プラットフォームとハイブリッド プラットフォームも管理できることです。しかも、すべてが 1 か所で行えます。」AI と自動化を活用したこの統合アプローチは、マネージド サービスの未来を表しています。

変革の道のりには課題がつきものです。成功するには、適切なパイロット クライアントの選択から新しい機能に関するチームのトレーニングまで、慎重な計画が必要です。しかし、サービス レベルの向上、コストの削減、より戦略的なクライアント関係などの結果は、努力するだけの価値があります。

傍観している MSP にとって、メッセージは明確です。IT 運用の未来は、より多くのツールやデータを持つことではなく、それらすべてを理解できるインテリジェントなシステムを持つことにあります。鍵となるのは、今すぐにその旅を始め、Synoptek のような成功した変革から学びながら、そのアプローチを特定のビジネス ニーズやクライアントの要件に適応させることです。

MSP 運用を変革する準備はできていますか?

AIを活用した可観測性の実装の詳細については、こちらをご覧ください。 LogicMonitorのMSPソリューション または、デモをリクエストして、これらの機能を実際に確認することもできます。

私たちのブログを購読する

このような記事をあなたの受信箱に直接お届けします