「大学のビジネスを監視し、予測し、それに取り組むことができないのなら、なぜ私たちは今していることをしているのでしょうか?」 – Ethan Bateman 氏、LSU のネットワーク オペレーション センターのマネージャー
課題:
ルイジアナ州バトン ルージュにあるルイジアナ州立大学には、35,000 人の学生と 250 以上の建物があります。 ネットワーク オペレーション センター (NOC) は、大学の 24 時間年中無休のシステム運用および監視センターであり、スタッフと学生がすべてをスムーズに実行できるように、休日やハリケーンなどを通じて年中無休で稼働しています。
多くの学術機関と同様に、LSU では、学生が毎年 100 月にキャンパスに戻るときに、ネットワークが大幅に急増します。 また、NOC のマネージャーである Ethan Bateman 氏にとっては、この需要の周期的な性質のために課題が生じます。 Bateman のチームは、大規模な環境全体で XNUMX% の接続性とアップタイムを同時に提供するという期待に応える準備ができていなければなりません。
「私たちは、リーダーシップのために機能する監視プラットフォームを必要としていました。 真の単一画面ビューを実現するには、そこにすべてを含める必要があります」と Bateman 氏は説明します。
可視性を向上させ、よりプロアクティブな監視エクスペリエンスを提供するために、LSU では、拡大するハイブリッド環境のニーズと迅速な異常検出および自動化に適合する、AI を活用したハイブリッド観測プラットフォームを必要としていました。
LSU は、公衆交換電話システムや学生情報システムをホストするメインフレームなど、環境の一部をオンプレミスのままにして、最新のハイブリッド IT インフラストラクチャに移行しています。 O365 ショップなどの他のリソースはクラウドにあります。
大学のシステムをクラウドに移行するために、Bateman 氏と彼のチームは、ビジネスが適切に機能し、ボトルネックを回避し、最高品質のサービスを提供できるようにする必要がありました。
解決法:
チームが可視性のニーズを満たすプラットフォームを探している間、LSU は監視に対する全体的で最新のアプローチのために LogicMonitor に目を向けました。 LogicMonitor を実装することで、LSU は以前のオープン ソース監視ソリューションによって引き起こされたいくつかの主要なビジネス上の課題に対処することができました。
「専任の人員を割く必要がなく、現場でインフラを管理する必要がないようにホストされ、単一の画面でハイブリッドな監視機能を提供できるものを見つける必要がありました」とベイトマン氏は語った。
LogicMonitor の SaaS ベースのアプローチと統一されたディスプレイにより、Bateman 氏と彼のチームは、最新のハイブリッド IT 環境に必要な可視性を得ることができ、潜在的な問題が発生する前に先手を打てるようになりました。 NOC チームは、問題を迅速に特定して解決するための受動的なアプローチやスクランブルの代わりに、プロアクティブなアラート構造を実装してダウンタイムを短縮できるようになりました。
ハイブリッド オブザーバビリティにより、NOC チームは組織にとってより付加価値の高い業務に従事できるようになりました。エンジニアリング チームとアーキテクチャ チームのライフサイクル アップグレードを支援し、テクニカル アーキテクチャ グループの新しいスイッチをインストールして構成し、組織の戦略的イニシアチブをサポートすることができました。
さらに、正確な根本原因分析は、LSU が問題を迅速に特定するのに役立っただけでなく、問題を適切な管理者にエスカレーションして迅速に解決するのに役立ちました。
「システムとインフラストラクチャのすべての部品と部品がプラットフォームにあり、スタックの上位に障害があり、根本原因がスタックの下位にある場合は、その管理者またはエンジニア チームにそれを持って行くことができます。情報」とベイトマンは説明した。 「これが私たちにもたらしていることは、たとえばアプリの管理者のところに行って、問題ではないのにアプリの実行速度が遅いと言う代わりに、すぐに問題に取り組み、より迅速に解決できることです。」
利点:
LogicMonitor はダウンタイムと停止を減らし、生産性の向上に貢献しています。 さらに、NOC チームは、サービスを継続的に稼働させるために、いつ問題が発生するかを予測できるようになりました。 予測モニタリングにより、チームは事前に問題に対処するための計画を立てることができます。これにより、プロセスの改善とミスの減少につながります。
「テストまたはクリーニングが必要なファイバー ラインの場合は、その特定のグループを関与させて迅速に解決できます」と Bateman 氏は述べています。
ハイブリッド オブザーバビリティがなければ、LSU は現在業界標準となっている 24 時間 7 日の稼働時間を維持するのがはるかに困難になります。同大学は、エンド ユーザーが問題を経験してからそのことを知るのではなく、LogicMonitor のメトリックとデータを活用して、潜在的なシステムまたはサービスの障害に積極的に対処しました。
「ユーザーが特定のリソースにアクセスできない、またはサービスが想定どおりに機能していないことをユーザーが電話するまでわからない場合は、宇宙が提供するものに対処し、緩和に時間を費やしているだけです。事後に。 稼働時間の標準を維持することに積極的ではありません」と Bateman 氏は言います。
LSU は、管理タスクとプラットフォーム管理に関しても、手動の作業負荷を減らすことができました。 以前のオープンソース ツールは、組織内の人々が維持するために、より多くの作業と貴重な時間を必要としていました。 LogicMonitor を使用することで、Bateman 氏とチームは、環境内の潜在的な問題を正確に予測することで、一般的なプラットフォームの維持管理ではなく、戦略的なプロジェクトに取り組むことに優先順位を付けることができます。
「可観測性に対する私のビジョンは、インフラストラクチャに存在するすべてのもののすべてのデータ ポイントとメトリックを確認できるようにすることです。なぜなら、起こっていることをすべて把握したら、物事を予測し始めることができるからです」と Bateman 氏は説明します。 「完全に壊れる前に、うまくいかないことがわかります。」
時間の経過とともに、Bateman のチームは巡回冗長検査 (CRC) エラーを監視します。これは、建物内のネットワークに障害が発生する差し迫った光障害を示しています。 ダウンタイムの意味は、学生にとって重要です。 30 分のダウンタイムでも、500 時間の生産性が失われる可能性があります。 LogicMonitor を使用して、チームはこれらのインスタンスを 100 回近く上回っています。
これらの CRC エラーは、データを送信する能力も低下させ、ユーザーに「低速ネットワーク」を認識させ、生産性にも大きな影響を与えます。
あるケースでは、各学年の初めに頻繁に使用される登録ポータルは、しばらくするとクラッシュします。 その時間は傾向を追跡するのに十分な一貫性がありませんでしたが、チームは、完全にクラッシュする前にロードが遅くなることを解読できました. 読み込み時間が長くなり始めると、LogicMonitor は警告を発することができ、管理者は 30 秒以内に再起動を有効にすることができました。 この問題にプロアクティブに対処できるということは、チームが機能停止が発生するのを待つ必要がなく、貴重な時間を管理者と連絡を取って問題の解決に費やす必要がなくなったことを意味します。 これにより、大学のエクスペリエンスが向上し、学生と IT チームの間の信頼が築かれました。
「ハイブリッド可観測性の最大のメリットは、100% のサービス稼働率であり、これが新しい標準です」とベイトマン氏は語った。
LSU は、LogicMonitor と提携してハイブリッドの可観測性と予測監視を実現し、100% のサービス可用性を維持しながら、最新のハイブリッド インフラストラクチャへの移行を継続します。