- Community Home
- >
- HPE Community, Japan
- >
- HPE Blog, Japan
- >
- Observabilityのパワーを体験してみよう
カテゴリ
Company
Local Language
フォーラム
ディスカッションボード
フォーラム
- Data Protection and Retention
- Entry Storage Systems
- Legacy
- Midrange and Enterprise Storage
- Storage Networking
- HPE Nimble Storage
ディスカッションボード
ディスカッションボード
ディスカッションボード
ディスカッションボード
フォーラム
ディスカッションボード
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
- BladeSystem Infrastructure and Application Solutions
- Appliance Servers
- Alpha Servers
- BackOffice Products
- Internet Products
- HPE 9000 and HPE e3000 Servers
- Networking
- Netservers
- Secure OS Software for Linux
- Server Management (Insight Manager 7)
- Windows Server 2003
- Operating System - Tru64 Unix
- ProLiant Deployment and Provisioning
- Linux-Based Community / Regional
- Microsoft System Center Integration
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
フォーラム
ブログ
Observabilityのパワーを体験してみよう
最近、「Observability(可観測性)」というワードに触れる機会も増えてきているのではないでしょうか。
今回のブログでは、Observability(可観測性)のパワーを具体的なソリューションを交えて、Pointnext事業統括 ハイブリッドクラウドソリューション部 シニアコンサルタント 小西 克博が解説します。
みなさん、こんにちは。HPE Pointnext のハイブリッドクラウドソリューションシニアコンサルタントの小西です。前回、可観測性が大事。ちゃんと観察しよう。という話をシャーロックホームズの逸話を交えて弊社中村より話してもらいました。今日は「可観測性」のパワーをみなさんに体験して頂きたいと思います。
観察しなさいといわれても、なかなか、なにをどれだけ見ればよいのだろうか?難しいですよね。
プロセスが死んだ。エラーを示すログが出た。そういう観測はされているかと思います。あとは、監視系のツールでも、CPU使用率、メモリ使用量、ディスク使用量などはデータをして保持しているかもしれません。
さて、そんな状況で、
「なんか、いつもよりもパフォーマンスが悪いような気がするんですよね」
というありがちで微妙な報告が上がってきたとします。
とりあえず、そのシステムの情報を監視システムで確認します。エラーは上がっていません。何かが止まった結果パフォーマンスが悪いわけではなさそうです。ただ、あるサーバーのディスクの使用率が非常に高くなっているという警告が出ています。
ディスクの使用率が高い。インフラの担当者からは、なぜそうなったのか?よくわからないので、そのシステムの担当者に連絡して詳細の調査を依頼することになります。
これが、可観測性をしっかりとできていた場合は、どういう調査になるでしょうか?アプリケーションのパフォーマンスを取得して分析するのが得意な製品、Kubernetes環境の情報取得が得意な製品など、様々な製品により可観測性を実現することができます。そういったなかで、今回は、すべてのログを収集して分析する製品として名高いSplunk Enterpriseを核としてIT運用を高度化できる製品であるSplunk ITSI(Splunk IT Service Intelligence)の画面を見ながら確認してみましょう。
Splunk ITSIを起動してみると、
たしかに、Database Response Timeが何やら赤く表示されています。なぜ赤くなっているのか気になるところです。ここで、TreeViewにして、依存関係を確認してみましょう。
TreeViewを確認すると、どうやら、mysql-02でDisk Fullになっていることがわかります。DiskFullになっていることが、このパフォーマンス劣化の原因なのかどうかはハッキリしませんが、とりあえず、なぜDiskFullになっているのを調査してみましょう
Deep Diveしてみます。
そうすると、さまざまな指標が時間軸で表示される形になっています。ぱっと見た感じ最初に赤い色があらわれるのがDisk Space Usedで、他の指標が黄色や赤に変わるのがそれよりも後なので、原因としてはここから始まっているっぽいですよね。あくまでっぽいなので、他の原因がないかの調査は別途必要かもしれません。まずは、ディスクの使用率が増えているその原因を考えてみましょう
実は、いま気にしているmysql-02はOSとしてWindowsを利用しているのですが、一番下にWindowsのイベントログの内容がこの一覧に出てきています(実際にはActive Directoryのログですね)。緑が濃い色になっているところでログが出ていることがわかります。みてみると、なんだか、scheduledというアカウントがロックアウトって言われていますよね。
ちょうど同じ時間帯でServiceNowのChange Requestがあるようですので、その内容のログを見ることができました。
なるほど、パスワードが変更されているのですね。
実は、定期的に実行するジョブをscheduledというアカウントで実行していて、それがログをローテーションして圧縮するジョブだった。というのは、この画面からわからない情報なのですが、そのアカウントのパスワードを変更したがために実行されなくなっているようです。
関係各所と調整して、DiskFullになっているログをローテンションして圧縮してDiskの空き容量を増やす暫定対応、パスワード変更による影響箇所を修正するなどの恒久対応などを実行して、このトラブル対応は終わりです。
今日は、これまでは現象が起こった際に様々なシステムやOSなどになにが起こったのか、それぞれのシステムにログインして各種ログを検索したり、性能情報、リソース利用状況グラフと見比べたりして確認しなければならなかったのを1ヶ所にすべてまとめておくと、しっかり「観察」できる。つまり、前回中村よりお話しさせて頂いたように「君はただ眼で見るだけで、観察ということをしない。見るのと観察するのとでは大違いなんだ。」ということをご理解頂けたところで、今日のお話は終わりたいと思います。
【関連過去HPE Blog】
セルフサービス仮想基盤をだけでなく、バックアップもDRも、ウイルス対策もすべてas a Serviceで提供します
ミッションクリティカルシステムのコンテナ化におけるポイントとは?
ハイブリッドクラウドに求められる監視ソリューション ~オブザーバビリティを実現し、ハイブリッドクラウド環境を可視化~
HPEすべての製品とサービスをお客様環境にas a Serviceで提供します。
Red Hat Partner Awards を3年連続で受賞しました!
HPE PointnextによるCI/CDパイプライン導入事例のご紹介
Google Cloud Partner Top Engineer アワード受賞
DXを支えるWorkstyle Transformation(WX)とInfrastructure Transformation(IX)
HPE DXプラットフォーム ハイブリッドクラウド
https://www.hpe.com/jp/ja/solutions/dx-platform.html#hybridcloud
HPE Pointnext Serviceで一歩先の未来へ
https://www.hpe.com/jp/ja/services/pointnext.html
- ブログへ戻る
- より新しい記事
- より古い記事
- kkuma 場所: HPE Linux技術情報サイトの歩き方~CentOS代替ディストビューション情報について~
- 土井康裕 場所: 篠田の虎の巻「PostgreSQL 15 GA 新機能検証結果」公開!
- MiwaTateoka 場所: Windows Server 2019のCertificate of Authenticity (C...
- 今更感 場所: 【連載】導入前のアドバイス – アレイコントローラー
- OEMer 場所: タイトル: HPE OEM Windows Serverのライセンスに関する質問にすべて回答しましょ...
- いわぶちのりこ 場所: 【連載】次世代ハイパーコンバージド「HPE SimpliVity」を取り巻くエコシステム ー 第3回...
- Yoshimi 場所: ジェフェリー・ムーア氏からのメッセージ - 未訳の新著 "Zone To Win" を解説! (2)...
- Yoshimi 場所: ジェフェリー・ムーア氏からのメッセージ - 未訳の新著 "Zone To Win" を解説! (...
- 三宅祐典 場所: 「HPE Synergy」 発表! ~ (3) この形・・・ ブレードサーバー??