HPE ProLiant
1748145 メンバー
3360 オンライン
108758 解決策
新規ポスト

HDDの抜き差しを繰り返すとHDDを抜いた時に、Physical DriveとLogical Driveのステータスが更新されない場合がある

 
takashi
時折のコレクター

HDDの抜き差しを繰り返すとHDDを抜いた時に、Physical DriveとLogical Driveのステータスが更新されない場合がある

SNMPのテストでHDDの抜き差しを繰り返すと、HDDを抜いた状態のままにしても、

Physical DriveとLogical Driveのステータスが更新されない場合があります。

 

通常は、HDDを抜くと、/var/log/hp-snmp-agents/snmp.logに以下のメッセージが記録されますが、

Physical DriveとLogical Driveのステータスが更新されない状態になると以下のメッセージが記録されません。

----

cmaidad[23255]: Logical Drive Status Change: Slot 0, Drive: 1.
Status is now Interim Recovery.

cmaidad[23255]: Physical Drive Status Change: Slot 0 Port 1I Box 1 Bay 2.
Status is now Failed.

----

 

この状態で、System Management HomepageでPhysical DriveのStatusを確認すると、

StatusはOKのままで、PageをRefreshしても状態は変わりません。

正常な場合は、StatusはFailedになります。 

 

また、SNMPでcpqDaPhyDrvStatus,cpqDaLogDrvStatusを確認してもOK(2)のまま変化しません。

 

しかし、hpacucliを実行すると以下のメッセージが出力され、hpacucliのアプリでは、

HDDが抜かれていることを認識できているようです。

 

$ hpacucli ctrl all show config

Smart Array P410i in Slot 0 (Embedded)    (sn: 5001438009185E10)

   array A (SAS, Unused Space: 0 MB)


      logicaldrive 1 (68.3 GB, RAID 1, Interim Recovery Mode)

      physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 72 GB, OK)
      physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 72 GB, Failed)

 

何が原因でPhysical DriveとLogical Driveのステータスが更新されないのでしょうか?

 

System Management HomepageでIdentify DriveのStartボタンを押すと、正常な状態に復帰します。

この操作と等価な処理をコマンドラインでも実行できるものでしょうか?

不具合回避に利用したいと考えています。 

 

また補足として、/etc/init.d/hp-snmp-agentsを実行しても正常な状態に復帰します。

 

サーバーはDL360G7で以下のソフトウェアを使用しています。

hp-snmp-agents-8.6.0-18-16.rhel4.i386.rpm

cpqacuxe-8.60-7.0.noarch.rpm

hpacucli-8.60-8.0.noarch.rpm

hpaducli-8.60-8.0.noarch.rpm

hpsmh-6.2.1-14.i386.rpm

hp-smh-templates-8.6.0.14-16.noarch.rpm

hp-health-8.6.0-24-24.rhel4.i386.rpm

hp-OpenIPMI-8.5.0-1.rhel4.i386.rpm

hp-ilo-8.5.0-1.rhel4.i386.rpm

 

 

4件の返信4
Boku wa
信頼あるコントリビューター

Re: HDDの抜き差しを繰り返すとHDDを抜いた時に、Physical DriveとLogical Driveのステータスが更新されない場合がある

takashiさん
こんにちわ。

解決策ではなく申し訳ないないのですが。。。

 

通常LinuxのAgentの場合、15秒間隔でハードウェアに対しpollingを行っています。
このpollingになんらか問題が発生し、ハードウェアのステータスが取得できなく
なったと考えられます。


cpqDaPhyDrvStatus,cpqDaLogDrvStatus の応答もあるようなので、
cmaidad のプロセスが止まっているわけではないようですし、
なんらかの問題を追うにも、cmaidad がどう動作しているかを確認する方法は
通常ありませんので、/etc/init.d/hp-snmp-agents を再起動するのが妥当だと思います。

OSが分かりませんが、HP ProLiant Support Pack 8.70 が適用できるなら試してみるのも手だと思います。


hpacucli については、cmaidad 経由で情報を取得するわけではないので、
正常にステータスが拾えているのだと思います。

 

よろしくです。

takashi
時折のコレクター

Re: HDDの抜き差しを繰り返すとHDDを抜いた時に、Physical DriveとLogical Driveのステータスが更新されない場合がある

Boku waさん

こんにちわ。回答ありがとうございます。助かります。

 

cmaidad のプロセスがどのような動作をしているか理解を深めることができました。

ありがとうございます!!

 

System Management HomepageでIdentify DriveのStartボタンを押すと、

問題のあったハードウェアに対するpollingが何故か復帰すると考えられますね。

これがコマンドラインで実行できればいいのですが、実行方法わからないですよね?

コマンドラインでの実行は用意されていないのですかね?

 

/etc/init.d/hp-snmp-agents で再起動だといろいろなプロセスが再起動されるので、

SNMPの監視側に問題がおきないかなど他への影響が心配です。

できるだけ影響範囲の少ない対処ができればと思っています。

 

OSはCentOS 4.7を使用しているので、HP ProLiant Support Pack 8.70 を試すのは難しそうです。

 

よろしくです。

 

Boku wa
信頼あるコントリビューター

Re: HDDの抜き差しを繰り返すとHDDを抜いた時に、Physical DriveとLogical Driveのステータスが更新されない場合がある

takashiさん

こんばんは。

 

OSはCentOS 4.7 なのですね~。

 

System Management HomepageのIdentify Driveについて探してみたのですけど、

SNMPのSetで行っているのか、直接何かしているのか、私はわかりませんでした。

 

お役に立てずごめんなさい。

 

よろしくです。

takashi
時折のコレクター

Re: HDDの抜き差しを繰り返すとHDDを抜いた時に、Physical DriveとLogical Driveのステータスが更新されない場合がある

Boku waさん

こんにちわ。

 

いろいろとアドバイス頂きありがとうございました。大変参考になりました。

 

今後ともよろしくです。