- Community Home
- >
- HPE Community, Japan
- >
- HPE Blog, Japan
- >
- Superdome Xは故障しないんだよね?いえいえ、故障しますよ。
カテゴリ
Company
Local Language
フォーラム
ディスカッションボード
フォーラム
- Data Protection and Retention
- Entry Storage Systems
- Legacy
- Midrange and Enterprise Storage
- Storage Networking
- HPE Nimble Storage
ディスカッションボード
フォーラム
ディスカッションボード
ディスカッションボード
ディスカッションボード
フォーラム
ディスカッションボード
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
- BladeSystem Infrastructure and Application Solutions
- Appliance Servers
- Alpha Servers
- BackOffice Products
- Internet Products
- HPE 9000 and HPE e3000 Servers
- Networking
- Netservers
- Secure OS Software for Linux
- Server Management (Insight Manager 7)
- Windows Server 2003
- Operating System - Tru64 Unix
- ProLiant Deployment and Provisioning
- Linux-Based Community / Regional
- Microsoft System Center Integration
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
Discussion Boards
フォーラム
ブログ
Superdome Xは故障しないんだよね?いえいえ、故障しますよ。
Superdome Xは故障しないんだよね?いえいえ、故障しますよ。
普通のサーバーとミッションクリティカルサーバーは、いったい何が異なるのでしょうか?よく誤解されることがあるのは、「ミッションクリティカルシステムは壊れない。」いえ、ミッションクリティカルシステムも機械ですので時には壊れます。ではいったい何が違うのか?先日実施した記者むけ技術説明会の内容から、今日はそんなお話をしたいと思います。
ポイントは「封じ込め」と「走りきる」技術
できるだけ故障しないような部品を選んだり、回路を設計したりするのはもちろんですが、それでも、機械ですので故障をしてしまうことはあります。ミッションクリティカルx86サーバーであるSuperdome Xがその他のサーバーと違う部分をシンプルに言うとすれば、
①故障はするけど、障害を「封じ込め」て、「走りきる」機能
②故障はするけど、その原因を「自動分析」して「記録を残す」機能
③故障はするけど、確実、超高速にスタンバイ機に「切り替える」技術
この3点が他の一般的なサーバーと異なる部分です。
今日はこの中から「封じ込め」て、「走りきる」技術の一つ、PCIe Live Error Recovery (略してPCIe LER)を紹介したいと思います。
一般的なサーバーとSuperdome Xの信頼性機能の差分
危険性が2倍になる、カード2枚挿し
「故障した場合に備えて、ネットワークのカードを2枚挿入しておきますね。」
サーバーを購入、導入された経験のある方であれば、こんな言葉、ベンダーの営業から聞いたことがあるのではないでしょうか?そして、それに対して何の疑問もなく、カードを2枚挿し。実はこの構成、下手をするとシステムを停止させてしまう確立を2倍にしてしまっているのです。
下の図をご覧ください。
一般的なサーバー(PCIe LERが無い場合)
この、2枚挿しているカードのうち、1枚が確実に死んでくれれば何の問題もありません。しかし厄介なのが、半死状態です。カードが半死状態になると、OSからデータをリクエストされたときに、まだ動いていますので変なデータを返してしまうことがあるのです。そうすると、OS側はその変なデータを受け取り、飲み込もうとすると、「やばい、その変なデータのせいで全体のデータを壊してしまう!」と寸前に気づき、「データを壊すよりも、システムを停止させたほうがいいだろう。」と判断し、システムを強制的に停止させてしまいます。
カード2枚挿し、半死だとシステム停止のリスクが倍になることがご理解いただけたかと思います。(もちろん、半死ではなく、完全に故障した場合は意味があります。)
Superdome Xに実装されているPCIe LERがあれば、このようなシステム停止を避けることが可能です。下記をご覧ください。
PCIe LERがシステム停止を回避
もしもカードが半死になって、変なデータが帰ってきたら、OSに届く前にSuperdome Xのファームウェアがそれを検知します。そして、OSに、「カードから変なデータが届いたからもう一度リクエストを送ってみて」という指令を送ります。そして、もう一度リクエストをOSに送らせてみて、それでも変なデータが届いたら、ファームウェアは「あ、このカードおかしくなっているな」と認識をして、このカードをシステムから切り離し、エラーを封じ込めます。そしてシステムは何事もなかったかのように動作を継続するのです。
Superdome Xも機械なので壊れます。しかし、その故障を「封じ込め」て、「走りきる」技術が他のサーバーより圧倒的に優れているので、システムを安定稼動させることが可能なのです。なお、この機能のデモVTRも現在準備中です。
次回以降、他の機能に関しても説明をしたいと思います。
- ブログへ戻る
- より新しい記事
- より古い記事
- kkuma 場所: HPE Linux技術情報サイトの歩き方~CentOS代替ディストビューション情報について~
- 土井康裕 場所: 篠田の虎の巻「PostgreSQL 15 GA 新機能検証結果」公開!
- MiwaTateoka 場所: Windows Server 2019のCertificate of Authenticity (C...
- 今更感 場所: 【連載】導入前のアドバイス – アレイコントローラー
- OEMer 場所: タイトル: HPE OEM Windows Serverのライセンスに関する質問にすべて回答しましょ...
- いわぶちのりこ 場所: 【連載】次世代ハイパーコンバージド「HPE SimpliVity」を取り巻くエコシステム ー 第3回...
- Yoshimi 場所: ジェフェリー・ムーア氏からのメッセージ - 未訳の新著 "Zone To Win" を解説! (2)...
- Yoshimi 場所: ジェフェリー・ムーア氏からのメッセージ - 未訳の新著 "Zone To Win" を解説! (...
- 三宅祐典 場所: 「HPE Synergy」 発表! ~ (3) この形・・・ ブレードサーバー??