LogicMonitor は、2024 Gartner Voice of the Customer の Observability プラットフォーム部門で、Gartner Peer Insights™ の Customers' Choice に選出されました。

続きを読む

ベストプラクティス

o11yとは何か? 可観測性の説明

可観測性 (しばしば o11y と略される) は、収集された既存のデータ ストリームから純粋に、技術スタックやアプリケーション全体の複雑なシステム、プロセス、およびマイクロサービス内で何が起こっているかを伝えることができることです。 もっと詳しく知る!

11年 (の略 可観測性ビー玉可観測性(オブザーバビリティ)とは、ログ、メトリック、トレースなどの外部データを分析することで、システムの内部状態を把握する機能です。IT チームがシステムを監視し、問題を診断し、信頼性を確保するのに役立ちます。現代の技術環境では、可観測性によってダウンタイムが防止され、ユーザー エクスペリエンスが最適化されます。

O11y は、ルドルフ・エミル・カルマンが制御理論の研究を通じて開拓したオリジナルのコンセプトに基づいています。本質的には、追加のコーディングやサービスが不要で、コストのかかるダウンタイムにつながることなく、複雑なシステムを監視できます。

主要な取り組み

チェックマーク
可観測性により、ITチームはログ、メトリック、トレースのテレメトリを使用してシステムの健全性に関する深い洞察を得て、問題を効率的に診断および防止できます。
チェックマーク
監視と可観測性は関連しているが異なるものであり、可観測性は外部出力を通じてシステムの内部状態をより包括的に表示する。
チェックマーク
可観測性の3つの柱を超えて、ユーザーエクスペリエンスとビジネス分析に焦点を当てることは、パフォーマンスを向上させ、IT指標をビジネス目標と一致させるために不可欠です。
チェックマーク
AIを活用した洞察、AIOps、プライバシーを考慮した可観測性などの将来のトレンドは、組織が可観測性戦略を最適化および拡張する方法を形作り続けるでしょう。

観測可能性と監視

可観測性はモニタリングと同じですか? いいえ。ただし、可観測性を実現する機能は、効果的な監視ツールとプラットフォームにいくらか依存している可能性があります。 効果的な監視ツールは、システムの可観測性を高めると言えます。

監視とは、誰かが行うアクションです。システムの有効性やパフォーマンスを手動で、またはさまざまな自動化を使用して監視します。監視ツールは、システムからデータを収集して分析し、洞察を提供し、必要に応じてアクションや調整を提案します。一部の監視ツールは、システムがダウンしたときや逆にシステムが再び稼働したときなどにシステム管理者に警告するなど、基本的でありながら重要な情報を提供できます。その他の監視ツールは、全体的なユーザー エクスペリエンスに影響を与える可能性のあるシステムのレイテンシ、トラフィック、その他の側面を測定する場合があります。より高度なツールは、数十、数百、さらには数千のデータ ストリームにリンクし、複雑なシステムに関する幅広いデータと分析を提供します。

可観測性は監視の一形態ではありません。むしろ、システムの機能について話すのと同じように、システム全体、つまり全体として考えられるシステムの側面の説明です。システムの可観測性は、出力を監視するだけで、観察者がシステムの内部状態をどれだけ正確に評価できるかを決定します。開発者がシステムの出力 (たとえば、APM によって提供される出力) を使用して、システムの全体的なパフォーマンスを正確に推測できる場合、それが可観測性です。

要約すると、監視は可観測性の同義語ではなく、その逆も同様です。 システムを監視しても、監視が効果的でない場合やシステムの出力が適切なデータを提供しない場合は、可観測性を達成できない可能性があります。 適切な監視ツールまたはプラットフォームは、システムが可観測性を実現するのに役立ちます。

可観測性により、データが実用的な洞察に変換され、チームはダウンタイムを防止し、シームレスなユーザー エクスペリエンスを提供できるようになります。

可観測性の3つの柱を理解する

可観測性を議論する一般的な方法は、それをXNUMXつのタイプに分解することです。 テレメトリー: メトリック、トレース、およびログ。 これらのXNUMXつの重要なデータポイントは、多くの場合、可観測性のXNUMXつの柱と呼ばれます。 これらの柱は可観測性を達成するための鍵ですが、それらはテレメトリであり、最終結果ではないことを覚えておくことが重要です。

ログ

船の船長の航海日誌のように、 テクノロジーと開発の世界でのログ システム内のイベントの書面による記録を提供します。 ログにはタイムスタンプが付けられ、バイナリやプレーン テキストなど、さまざまな形式で提供されます。 テキストとメタデータを組み合わせた構造化されたログもあり、多くの場合クエリが簡単です。 ログは、システム内で何が問題になったかにアクセスするための最も迅速な方法です。

メトリック

メトリックは、一定期間にわたって監視されるさまざまな値です。 メトリックは、主要業績評価指標(KPI)、CPU容量、メモリ、またはシステムの状態とパフォーマンスのその他の測定値である可能性があります。 時間の経過に伴うパフォーマンスの変動を理解することは、ITチームがユーザーエクスペリエンスをよりよく理解するのに役立ち、それがユーザーエクスペリエンスの向上に役立ちます。

形跡

トレースは、システム全体のユーザーインターフェイスから、要求が処理されたという確認を受け取ったときにユーザーに戻るまでの過程で、ユーザー要求を記録する方法です。 要求に応じて実行されたすべての操作は、トレースの一部として記録されます。 複雑なシステムでは、XNUMXつのリクエストが数十のマイクロサービスを通過する場合があります。 これらの個別の操作またはスパンのそれぞれには、トレースの一部となる重要なデータが含まれています。 トレースは、システムのボトルネックを特定したり、プロセスがどこで故障したかを確認したりするために重要です。

完全な可観測性を実現するには、システムの一部だけではなく全体を把握し、すべての決定がリアルタイム データに基づいていることを保証する必要があります。

可観測性を実現するための追加要素

このテレメトリを使用しても、可観測性は保証されません。ただし、詳細なメトリック、ログ、トレースを取得することは、可観測性にアプローチする優れた方法です。これらの異なるタイプのテレメトリ、特にそれらが提供するデータには、ある程度の共通点があります。 

たとえば、レイテンシに関するメトリックは、システム内でレイテンシが発生する場所を示すことでレイテンシに関する情報も提供する、ユーザー リクエストのトレース セットと同様の情報を提供する場合があります。そのため、可観測性を総合的なソリューション、つまりさまざまな種類のテレメトリを使用して作成されたシステム全体のビューとして捉えることが重要です。

イベントは、可観測性を実現するために使用できる別のタイプのテレメトリです。 多くの場合、ログ、メトリック、およびトレースは、システムイベントのまとまりのあるビューを提供するために使用されるため、システム内のさまざまなイベントによって提供される元のデータのより詳細なテレメトリと見なすことができます。

依存関係または依存関係マップにより、各システム コンポーネントが他のコンポーネントにどのように依存しているかを視聴者が理解できます。これは、ITOps がシステム内のどのアプリケーションと環境が IT リソースを使用しているかを明確に理解できるため、リソース管理に役立ちます。

どのテレメトリの正確なタイプが使用されているかに関係なく、可観測性は、さまざまな形式のデータを組み合わせてこの「全体像」ビューを作成することによってのみ達成できます。 可観測性の柱のXNUMXつだけでは、システムの可視性と保守の点でほとんど価値がありません。

可観測性の重要性とその採用拡大

しかし 概念としての可観測性 工学と制御理論の領域から来て、それは技術の世界によって広く採用されています。 テクノロジーは急速に進歩しているため、開発者はシステムを絶えず更新および進化させる必要があります。そのため、急速に変化するシステムの内部で何が起こっているのかを理解することがこれまで以上に重要になっています。 

可観測性を実現することで、ユーザーは、エンドユーザーエクスペリエンスに悪影響を与えることなく、ソフトウェアとアプリを安全に更新および展開できます。 言い換えれば、o11yは、ITチームに必要に応じてアプリやソフトウェアを革新する自信を与えます。

可観測性により、開発者や運用チームはシステムに対するはるかに高いレベルの制御が可能になります。これは、本質的にさまざまなコンポーネントの集合、またはネットワーク化された他のより小さなシステムの集合である分散システムではさらに当てはまります。これらのさまざまなシステムからのデータストリームは非常に多く、手動でこのデータを照合することは不可能です。そこで、自動化と高度な、理想的にはクラウドベースの、 最新の監視 膨大な量のデータを処理するには、ソリューションが不可欠です。ただし、可観測性を実現するには、これらのデータ ストリームの品質によって、可用性とパフォーマンスに関する質問に回答し、効率的に処理できるレベルの詳細な可視性が提供される必要があります。

最新の開発手法には、継続的デプロイと継続的インテグレーション、DockerやKubernetesなどのコンテナーベースの環境、サーバーレス機能、さまざまなアジャイル開発ツールが含まれます。 APMのみのソリューションでは、チームが今日のアプリ、サービス、インフラストラクチャを稼働させ、デジタル的に要求の厳しい消費者ベースに関連させるために必要な洞察を提供するために必要なリアルタイムデータを提供できません。 可観測性は、コンテキストが豊富なデータの忠実度の高いレコードを示し、より深く、より有用な洞察を可能にします。

可観測性の3つの柱を超えて拡大 

可観測性のXNUMXつの柱だけでは、システムの内部状態を検討するときに望ましい全体的なビューが提供されないことに注意することが重要です。 について考えるより良い方法 ハイブリッド可観測性 個々のコンポーネントに焦点を当てるのではなく、3 つの柱と上記のその他の考慮事項を総合的に組み合わせて、テクノロジー エコシステム全体の全体的かつ詳細なイメージを検討することが考えられます。 

トレーシング ペーパーを何枚も使って描いた絵を想像してください。最初の葉には背景が描かれています。次の葉をのせると、木や家が見えます。次の葉にはキャラクターが描かれ、最後の葉には吹き出しがあり、登場人物が何を言ったり、何をしているかが示されています。それぞれの葉は、それ自体では絵の正確な一部ですが、それ自体ではほとんど意味をなしません。完全に文脈から外れています。

すべてのコンポーネントを組み合わせると、誰もが理解できる詳細な画像が作成されます。 これは効果的な可観測性であり、すべてのコンポーネントをシステムのXNUMXつの全体像として慎重に検討することによってのみ達成できます。 各データポイントはテレメトリの形式であり、テレメトリを効果的に組み合わせることで可観測性が実現されます。 可観測性ベースのソリューションは、ユーザーがその詳細なテレメトリを利用して開発の機会を最大化できるプラットフォームとダッシュボードを提供します。

ITチームは、可観測性のXNUMXつの柱を提供するために、XNUMXつの異なるベンダーに支払う必要があると考える傾向があります。これは、コストがかかる可能性のある作業になります。 もう一度、可観測性が非常に重要なポイントに戻ります 包括的なつまり、このテレメトリをすべて個別に使用することは、可観測性を実現するための鍵ではありません。 テレメトリは連携して機能する必要があります。つまり、XNUMXつの柱は良い出発点ですが、エンドポイントではなく、効果的に保守可能なシステムを保証するものでもありません。

可観測性におけるユーザーエクスペリエンスとビジネス分析

可観測性の3つの柱であるメトリクス、ログ、トレースは不可欠ですが、これらだけに焦点を当てると、 ユーザーエクスペリエンス(UX)ビジネス分析LogicMonitorのような最新の可観測性プラットフォームは、生データを超えた洞察を提供し、シームレスな ワンクリック可観測性™ システム間のユーザー ジャーニーを評価するためのエクスペリエンス。

ユーザーエクスペリエンスを中心とする

今日の分散環境では、完全な可観測性を実現するには、内部システムの状態を追跡する以上のことが求められます。ユーザーが中断することなく最適なパフォーマンスを体験できるようにすることも必要です。LogicMonitor の One-Click-Observability™ を使用すると、チームは手動介入なしでアラートを関連するログやメトリックとすばやく相関させ、システムの問題がエンドユーザーのパフォーマンスにどのように影響するかを総合的に把握できます。異常を自動的に検出し、事前構成されたビューを提供することで、IT チームは自信を持って根本原因を特定し、ユーザー エクスペリエンスを向上させることができ、ダウンタイムの削減と応答時間の短縮につながります。

ビジネス分析: IT とビジネス成果の連携

効果的な可観測性は、ビジネス成果に直接影響します。可観測性プラットフォームは、システム パフォーマンス メトリックをリアルタイムで追跡できるため、企業はアプリケーション パフォーマンスがコンバージョン率、ユーザー エンゲージメント、収益創出などの主要目標にどのように影響するかを監視できます。ビジネス分析を可観測性ダッシュボードに統合することで、企業は IT メトリックを運用パフォーマンスと相関させ、チームが積極的にリソースを最適化して成長戦略をサポートできるようになります。LogicMonitor のプラットフォームは、企業がデータ主導の意思決定を行えるようにし、可観測性を使用して技術的な問題を解決するだけでなく、全体的なビジネス効率を高めます。

可観測性の主な利点

もちろん、システムの保守と改善の容易さという点で開発者だけでなく、ビジネス全体にとっても測定可能なメリットがない限り、システムの可観測性の向上に重点を置く意味はありません。

コスト削減

どのようなビジネスでも、意思決定の大半はコストや利益に関する懸念によって行われます。アプリやシステムの開発、運用、更新にかかるコストが高ければ高いほど、そのコストを消費者に転嫁しなければならない可能性が高くなります。これによりシステムの見かけ上の価値が下がる可能性があるため、コストを抑えて利益を増やすものは何でも歓迎されます。システムの内部状態をより良く、より直感的に理解することで、ITOps と DevOps のコストを下げることができます。効果的なデータ ストリームをデータ分析と適切な監視プラットフォームと組み合わせると、手動での監視の必要性が減り、更新をより迅速かつ確実に行うことができます。これにより、システムを最高のパフォーマンスに保つために必要な従業員の労働時間が短縮され、更新がより速く、より効果的になることで、システム全体の価値が高まります。

DevOps でユーザー エクスペリエンスを優先できるようにする

開発者や運用チームがシステムの内部構造を深く調べるのに何時間も費やす必要がなくなれば、より生産的な時間を活用できるようになります。つまり、重要な指標にユーザーが関与するためのよりよい方法を考え、全体的なユーザー エクスペリエンスを向上させることに時間を費やせるのです。繰り返しになりますが、これは経済的な意味合いもあります。システムがよりうまく機能すればするほど、消費者にとってより魅力的になるからです。無料のソフトウェアやアプリであっても、シームレスに機能すれば、当該開発チームの評判が高まり、企業価値が高まります。

ダウンタイムとシステム障害の防止

企業のシステムが完全に社内向けであるか、消費者にサービスを提供するために使用されているかにかかわらず、ダウンタイムは壊滅的な被害をもたらす可能性があります。IT 危機が発生した場合に備えて緊急時対応計画を用意しておくことは素晴らしいことですが、システムをほとんどの時間オンラインに維持できる観測可能なソリューションがあればさらに良いでしょう。システムの状態を詳細かつ総合的に把握することで、システムが完全にダウンする原因となる可能性のある問題に対処するために、変更や更新を迅速に行うことができます。観測可能性は安定性を促進します。これは、消費者が日常的に使用するアプリやソフトウェアにますます期待するものです。

将来の計画と拡張性の向上

システムの内部動作の詳細な可視性と豊富なデータおよびイベント分析を組み合わせることで、DevOps は現在発生している問題に対処するだけでなく、将来のイベントを予測して将来に向けて効果的に計画を立てることもできます。これは、潜在的なピーク時間と容量の変動を把握することで実現でき、リソースを効果的に再割り当てできます。また、新しいサービスのテストがより適切である可能性のある静かな時間を DevOps に通知することもできます。さらに、観察可能なシステムがあれば、それらのテストはさらに効果的になり、システム クラッシュやダウンタイムが発生する可能性が低くなります。

一般的な可観測性のユースケース

現代の IT システムにおける可観測性の一般的な使用例には、次のようなものがあります。

  • システムの健全性の監視: 観測可能なシステムにより、状態とパフォーマンスをリアルタイムで監視し、問題を迅速に解決できます。
  • 異常の検出: 観測可能なシステムは、異常やパターンを識別するのに役立ち、将来起こり得る問題を積極的に管理できます。
  • ボトルネックの特定: 可観測性により、DevOps がボトルネックを見つけ、リソースを再割り当てしてスケーラビリティを向上させるのに役立つ洞察が明らかになります。
  • トラブルシューティング: データ系統追跡により、DevOpsは迅速にトラブルシューティングを行い、根本原因を特定することができます。 平均解決時間(MTTR)の短縮.
  • リソースの最適化: リソースの使用状況を明確に把握することで、DevOps は割り当てを最適化し、効率を高めてコストを削減できます。
  • 変更の検証: 変更前後のシステム パフォーマンスを監視することで、更新がシステム全体のパフォーマンスに悪影響を与えないことが保証されます。

可観測性を実現するための主な課題

可観測性を達成しようとするときに発生するいくつかの課題については、すでに説明しました。 重要なのは、個々のベンダーにこれらを提供するために支払うという点で、最高のメトリックデータまたは最も完全なトレースを持つことに固執するようになっています。 これは、このテレメトリを照合および結合することをいとわない企業にとっては効果的なソリューションですが、これらすべての情報をXNUMXか所にまとめることは可観測性にはるかに近くなります。

よくあるもう 1 つの課題は、この記事の前半で説明したように、可観測性の 3 つの柱にこだわるのではなく、その先を見据えることです。その他の課題には次のものがあります。

  • スケーラビリティ–ソフトウェア、アプリ、およびシステムがどのように成長(または縮小)しても、同じレベルの可観測性を実現します。
  • ますます複雑になるクラウド環境。
  • 動的コンテナとマイクロサービス。
  • さまざまなソースからのデータとアラートの量と種類の増加。
  • DevOps やその他のチームは、必ずしも相互に同期しない複数の監視ツールや分析ツールを使用します。

一部の企業がこれらの障害を克服するのは困難に思えるかもしれませんが、これらの課題に正面から対処するための賢明で効率的な方法を検討することで、良好な可観測性を実現できます。

将来を見据えた可観測性戦略の構築

可観測性のスケーラビリティに対処するには、まず他の課題のいくつかに対処する必要があります。システムがさまざまなクラウドベースの環境に対応している場合は、クラウドのみで機能するか、ハイブリッド環境で機能する高度な監視ツールについて検討する価値があります。最新のクラウドに対応するように構築されたツールは、クラウド環境内の変更に適応する可能性が高く、データ分析の安定性と一貫性をユーザーに提供します。

のような主要ベンダー Amazon Webサービス (AWS)、GCP、Azureはすべて、 オーテルまたは OpenTelemetryプロジェクト。 このプロジェクトは、「高品質のテレメトリをクラウドネイティブソフトウェアの組み込み機能にする」ことを目的としています。 これは、アプリとソフトウェアのクラウドベースの未来に投資しているDevOpsチームにとって素晴らしいニュースです。 OTelは、純粋にシステムのパフォーマンスと動作を分析するためのツール、SDK、およびAPIを提供する、「可観測性フレームワーク」と自称しています。 目的は、企業がどのサードパーティベンダーを選択するかに関係なく、ある程度の可観測性を提供し、可観測性のためのローコードまたはノーコードソリューションを提供することです。

可観測性ソリューションのスケーラビリティを確保するもう 1 つの方法は、適切なタイプのデータ ストアが使用されていることを確認することです。データ ストアとデータ ウェアハウスは、増加するデータ量とさまざまなソースからストリーミングされるさまざまな種類のデータに対応するために、飛躍的に拡張および多様化で​​きる必要があります。ETL および ELT ソリューションは、データを 1 つの使用可能な形式で 1 ​​つの宛先にまとめるのに役立ちます。ここでも、システム全体がどのように機能するかを確認し、システムまたはソフトウェアの成長に合わせてシステムのあらゆる側面が成長できるようにすることが重要です。

2025 年の IT オブザーバビリティの未来はどのようなものですか?

将来の IT オブザーバビリティの正確な軌道を予測することは困難ですが、今後数年間で業界を形作る可能性が高いいくつかの傾向を特定することができます。

  1. AI と ML の継続的な進歩: AI および ML テクノロジーが成熟し続けるにつれて、自動化された異常検出、根本原因分析、および予測分析がさらに改善されることが期待できます。 これにより、組織は、エンド ユーザーに影響が及ぶ前に問題を特定して解決することにおいて、さらに積極的になることができます。
  2. AIOps と自律システムの台頭: AI と ML を IT 運用 (AIOps) に統合することで、自己修復と自己最適化が可能な、より自律的なシステムへの道が開かれます。 これにより、IT チームの負担が軽減され、システム全体の信頼性が向上します。
  3. サーバーレスおよびサービスとしての機能 (FaaS) 可観測性: サーバーレス アーキテクチャと FaaS の採用が進むにつれて、新たなオブザーバビリティの課題が発生します。 業界は、サーバーレス アプリケーションとインフラストラクチャを監視、トラブルシューティング、および最適化するための新しいアプローチとツールを開発する必要があります。
  4. プライバシーを意識した可観測性: プライバシー規制が進化し続けるにつれて、可観測性データが適用される法律および規制に準拠して収集、保存、および処理されることを保証することがますます重視されるようになります。 これは、プライバシーを保護する可観測性の技術とツールの開発につながる可能性があります。
  5. 強化されたネットワーク可観測性: エッジ コンピューティング、5G、IoT の継続的な拡大に伴い、 ネットワーク可観測性 さらにクリティカルになります。 これらのネットワークの複雑さと規模の増大を管理するには、高度な監視および分析ツールが必要になります。
  6. より詳細でリアルタイムのインサイト: 組織が IT システムへの依存度を高めるにつれて、システムのパフォーマンスと正常性に関するリアルタイムで詳細な洞察に対する需要が高まり続けます。 これにより、このレベルの詳細を提供できる、より洗練された監視および分析ツールの開発が促進されます。
  7. 量子コンピューティングの可観測性: 量子コンピューティングが勢いを増し始めると、これらの新しいシステムを監視、管理、および最適化するために、新しい可観測性ツールと技術が必要になります。

完全な可観測性にどれだけ近づいていますか?

完全な可観測性にどれだけ近いかを理解するには、次の質問について考える必要があります。

  • ログ、トレース、メトリックなどの主要なテレメトリを取得するのはどのくらい簡単ですか?
  • このテレメトリからどのようなレベルの分析が得られますか? あなたにとってどの程度役立ちますか?
  • システムの内部状態を理解するために、追加のコーディングと開発を行う必要がありますか?
  • システム全体の全体像をリアルタイムで分析できますか?

「非常に簡単」、「非常に詳細」、「いいえ」、「はい」の順に答えた場合、システムとソフトウェア内で完全な可観測性を実現することに近づいている可能性があります。詳細な分析によってスケーリングが突然急増しても問題にはなりません。詳細な分析によってスケーリングが予測され、システムの既存のリソースを浪費することなく簡単に実装できるソリューションが提供されるからです。レイテンシーやインフラストラクチャの問題は、効果的なトレースと正確なログやメトリックの組み合わせによって簡単に特定され、効果的に表示されて正面から対処できます。ダウンタイムはほとんど発生せず、発生したとしても、関連するシステムの詳細で一貫したビューと理解があるため、最小限の時間で済みます。

それでもこのような問題に対処できない場合は、システムの全体的な可観測性と、システムの復元力を高めるために必要なツールや変更を調べる価値があるかもしれません。

長期的な成功のために可観測性を最大化する

まとめると、可観測性の 3 つの柱は重要ですが、それらは可観測性を実現するためのテレメトリのソースであり、それ自体が最終目標ではありません。これに加えて、その他の有用なデータ ソースを使用して可観測性を実現できます。複雑なシステムは、クラウドベースの環境を念頭に置いて構築された効果的な監視ツールに依存していますが、これらのツールを利用しても可観測性が保証されるわけではありません。可観測性はシステム自体に関する全体的な概念だからです。最後に、投資する可観測性ソリューションは何でも、ビジネスの成長に合わせて適応性と拡張性を備えている必要があります。

私たちのブログを購読する

このような記事をあなたの受信箱に直接お届けします