HPE Blog, Japan
1825719 メンバー
2875 オンライン
109686 解決策
新規ポスト
NaomiN

そのツール、見てはいるが、観察していますか?

障害に「早く対処する」ためには何が重要なのでしょうか?

 

image26.png

 

 

 

 

 

 

 

 

 

今回は、運用管理における重要ポイントを、Pointnext事業統括 GreenLake&コンサルティング推進本部 ハイブリッドクラウドソリューション部 中村 憲仁 が解説します。

 

Profile17.jpg

 

イギリスの作家、コナン・ドイルによって書かれた「シャーロック・ホームズ」シリーズの中に「ボヘミアの醜聞(しゅうぶん)」という作品があります。作中にホームズがワトソンに対して「君はただ眼で見るだけで、観察ということをしない。見るのと観察するのとでは大違いなんだ。」と述べるシーンがあります。

出来事に対して、ただ見るだけではなく観察する。意識しているからこそ見えるものがあるという教えです。

この教訓、IT運用でも同じではないでしょうか?

今回は、ITインフラの運用に関わっている方、特にオンプレのシステムをクラウド移行(単純なリフト&シフト)した結果、運用負荷が上がって悩んでいる方へ、何をどう改善していけば良いかのヒントになればと思いお話します。

昨今、運用管理について様々な相談を頂きますが、それを簡単にまとめると、「従来の仕組み、発想は簡単に変えられない。しかしパブリック環境が増え、運用環境は激変中!このままでは不安材料しかない。」という内容になります。

なぜ不安になるのか?を少し見ていきましょう。

パブリッククラウドではITシステムが動的に変化してしまうので、オンプレと同様な監視の仕組みではどうしても
・検出漏れが発生
・各分析に物凄く長い時間がかかる
・対応のツボを心得ている人が一握り(属人化)
という問題が発生します。
その結果、ITサービスの稼働を安定維持できなくなると思い、不安になってしまうのではないでしょうか?

既存環境ではITIL® *ベースのお客様が多いと思います。
ITIL® では何か障害が起こると障害対応の各工程を、検出・診断・修理・復旧・回復と定義していますが、これを丸めて言うと、障害に「早く気付く」、障害を「早く理解する」、障害に「早く対処する」と言い換えることが出来るでしょう。

障害に「早く対処する」ためには、「早く気付く」ことはもちろんですが、「早く理解する」ことが重要です! 

「早く理解する」には、「障害の影響分析」及び「原因分析」が必要なのですが、その為には、構成トポロジーの把握、すなわち構成要素同士の依存関係を把握することが必須となります。何故これが必須なのかと言うと、障害はたとえ震源地が一箇所であっても、必ず玉突き事故となって連鎖・波及して行きます。
この潜在的な波及先として、依存関係を予め把握しておくことは必要不可欠な行為となるからです。

同じように、障害発生後の故障・性能事象の把握、すなわち障害事象同士の相関関係を把握することも必要で、これが実際の玉突き事故の連鎖関係を把握する行為になります。

このように、運用管理システム、運用監視システムにとって、「関係」というモノを把握することは非常に大事であり、ITシステムが動的になればなるほど、関係は刻々と変化することになり、関係を把握することは増々困難になるので、常日頃から観察(Observe)できるツールも導入しておくことが重要となるのです。

 

可観測性.jpg

 

監視(Monitoring)は「何が起きているのかを見続けること」に対し、観察(可観測性:Observability)は「予期せぬことが起きたときになぜそれが起きたのかを把握すること」ですが、これらのツールを用い、多様な対象から例外なくデータを取得し、リアルタイムにデータを分析することで、障害時に「早く理解する」ことが可能になり、運用負荷を下げることができます。

 

統合監視基盤.JPG

 

今回は「早く理解する」為の最初の1歩として観察(Observability)のお話を主にしましたが、運用全体を最適化したい、など何かお悩みごとがございましたら、お気軽にご相談ください。

 

* ITIL®  (Information Technology Infrastructure Library)とは、ITサービスマネジメントにおけるベストプラクティス(成功事例)をまとめた書籍群です

 

ITIL® は AXELOS Limited の登録商標であり、AXELOS Limited の許可のもとに使用されています。すべての権利は留保されています。

 

 

【関連過去HPE Blog

ミッションクリティカルシステムのコンテナ化におけるポイントとは?

ハイブリッドクラウド環境における Anthos の使い所

ハイブリッドクラウドに求められる監視ソリューション  ~オブザーバビリティを実現し、ハイブリッドクラウド環境を可視化~

HPEすべての製品とサービスをお客様環境にas a Serviceで提供します。

Red Hat Partner Awards を3年連続で受賞しました!

HPE PointnextによるCI/CDパイプライン導入事例のご紹介

Google Cloud Partner Top Engineer アワード受賞

DXを支えるWorkstyle Transformation(WX)とInfrastructure Transformation(IX)

 

 

HPE DXプラットフォーム ハイブリッドクラウ

https://www.hpe.com/jp/ja/solutions/dx-platform.html#hybridcloud

 

HPE Pointnext Serviceで一歩先の未来

https://www.hpe.com/jp/ja/services/pointnext.html

 

 

 

 

 

 

 

0 感謝
作者について

NaomiN

Pointnext事業統括 コンサルティングビジネス開発部