ハードウェア(UNIXサーバー製品)
キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

ディスク交換後のSCSIエラーについて

S_N
アドバイザー

ディスク交換後のSCSIエラーについて

いつも勉強させていただいております。

早速質問ですが、先日A500の内蔵ディスク障害が発生したため交換を行いました。

ミラーの内セカンダリ側のディスクです。

交換後のioscanは以下の内容です。

-----

# ioscan -nfkCdisk

Class I H/W Path Driver S/W State H/W Type Description

======================================================================

disk 2 0/0/1/0.4.0 sdisk CLAIMED DEVICE HP DVD-ROM 304

/dev/dsk/c0t4d0 /dev/rdsk/c0t4d0

disk 0 0/0/1/1.15.0 sdisk CLAIMED DEVICE SEAGATE ST336704LC

/dev/dsk/c1t15d0 /dev/rdsk/c1t15d0

disk 1 0/0/2/1.15.0 sdisk CLAIMED DEVICE SEAGATE ST336704LC

/dev/dsk/c3t15d0 /dev/rdsk/c3t15d0

-----

問題無く認識されているのですが、syslogの方には、以下のようにエラーと見られるメッセージが出力されます。

-----

Sep 27 11:46:32 ServerA vmunix: SCSI: Reset detected -- lbolt: 17224, bus: 3



Sep 27 11:46:32 ServerA vmunix: SCSI: Reset detected -- lbolt: 17322, bus: 3



Sep 27 11:46:32 ServerA vmunix: SCSI: Reset detected -- lbolt: 17322, bus: 3



Sep 27 11:46:32 ServerA vmunix: SCSI: Reset detected -- lbolt: 17823, bus: 3



Sep 27 11:46:32 ServerA vmunix:



Sep 27 11:46:33 ServerA above message repeats 19 times

Sep 27 11:46:32 ServerA vmunix: lbp->state: 6060



Sep 27 11:46:32 ServerA vmunix: lbp->offset: ffffffff



Sep 27 11:46:32 ServerA vmunix: lbp->uPhysScript: f877e000



Sep 27 11:46:32 ServerA vmunix: From most recent interrupt:



Sep 27 11:46:32 ServerA vmunix: ISTAT: 22, SIST0: 02, SIST1: 00, DSTAT: 80, DSPS: 0000000a



Sep 27 11:46:32 ServerA vmunix: lsp: 0



Sep 27 11:46:32 ServerA vmunix: lbp->owner: 408b6400



Sep 27 11:46:32 ServerA vmunix: bp->b_dev: cb030002



Sep 27 11:46:32 ServerA vmunix: scb->io_id: 300001a



Sep 27 11:46:32 ServerA vmunix: SCSI: Reset detected -- lbolt: 17223, bus: 3



Sep 27 11:46:32 ServerA vmunix: scb->cdb: 12 00 00 00 80 00



Sep 27 11:46:32 ServerA vmunix: lbolt_at_timeout: 0, lbolt_at_start: 0



Sep 27 11:46:32 ServerA vmunix: lsp->state: 5



Sep 27 11:46:32 ServerA vmunix: SCSI: Reset detected -- lbolt: 17222, bus: 3



-----

ディスク交換後にミラーの設定はしておらず、ただ刺さっている状態です。

またディスク交換後、プライマリディスクのみで稼動してますが、頻繁にシステムダウンするようになりました。

再起動により、とりあえず使用可能にはなります。

ディスク交換により諸々の問題が発生しているのは分かるのですが、上記情報から原因あるいは対策についてご教授願えれば幸いです。

類似事例は参照しましたが、いまひとつ理解できませんでした。

長文で申し訳ありませんが、よろしくお願いいたします。

HP-UX 11.0
4 件の返信
nadachi
レギュラーアドバイザー

ディスク交換後のSCSIエラーについて

出ているエラーメッセージからすると、

SCSI: Reset detected -- lbolt: 17224, bus: 3

のように "SCSI: Reset detected" が主ですから、SCSI bus 3 のSCSI カードが、SCSIバスのRST信号を検出しているのを示しています。

scb->cdb: 12 00 00 00 80 00

の部分は、SCSI の INQUIRYコマンドですから、ディスクのread/writeまでいっていない。

SCSIのコネクタ、ケーブル、ターミネータあたりが不安定で、RST信号が頻繁にAssertされているのでは ?
S_N
アドバイザー

ディスク交換後のSCSIエラーについて

nadachi様

早速の返信ありがとうございます。

コネクタ、ケーブル、ターミネータの接続については再度抜き差しなどして確認してみます。

ところで、SCSI bus 3というのは、今回交換した側のディスクになると思いますが、こちらにRST信号が出る関係でプライマリ側のディスクに影響(システムダウン)が出ているという認識でいいのでしょうか。

rawsq
貴重なコントリビューター

ディスク交換後のSCSIエラーについて

> ところで、SCSI bus 3というのは、今回交換した側のディスクになると思いますが、こちらにRST信号が出る関係でプライマリ側のディスクに影響(システムダウン)が出ているという認識でいいのでしょうか。

SCSIバスが異なりますので、今回のRST信号がプライマリ側のディスクに直接影響を及ぼしていることはないと思います。

あるとすれば、大量のRST信号がカーネルに影響しているのでは?と私は思います。

(RST信号検出->syslogへ書き込み->プライマリディスクへのアクセス発生、と考えると影響は出ていますが...)

交換のタイミングで今回の事象が発生しているようなので、既にご指摘のとおりインターフェース周りのチェックが必要だと思います。

内蔵ディスクなのでコネクタの確認は必要かもしれません。

あっさり抜き差しで直る気もしますが、最悪は交換したディスク上のコントローラがいかれているかもしれません。
S_N
アドバイザー

ディスク交換後のSCSIエラーについて

お返事が遅れましたが、結局ディスクの交換にて回復いたしました。

SCSIのエラー、システムダウンとも発生しなくなりました。

ご教授いただいた方々どうもありがとうございました。