HP-UX General
1825773 メンバー
2065 オンライン
109687 解決策
新規ポスト

EMS のメッセージについて

 
Y_M
頻繁なアドバイザー

EMS のメッセージについて

私の管理しているサーバにて突如下記メッセージが出力されるようになりました。

EMS Event Notification----- Value:"MAJORWORNING (3)" for Resource: "/storage/events/disk_array/FC60/AM60Srvr" ( Threshold: >=3)

どなたか本メッセージの意味と対処方法をご存知の方はおられませんでしょうか。

(ちなみにAM60SrvrのSTOP/STARTは実施したのですが、状況は変わりません。)
16件の返信16
K_Ta
頻繁なアドバイザー

EMS のメッセージについて



/var/opt/resmon/log/event.log に詳しい内容がログされていませんか?
Y_M
頻繁なアドバイザー

EMS のメッセージについて

event.logに詳しい内容は記載されており、その内容に従ってAM60Srvrの再起動をしたのですが、事象が収まりません。

何か本件についてパッチ等がリリースされていないかと思い投稿させてもらいました。
K_Ta
頻繁なアドバイザー

EMS のメッセージについて



その詳しい内容がわからないと、何とも言えないです・・・。
S_A
時折のアドバイザー

EMS のメッセージについて

もし、コントローラがFAIL等のメッセージが出力されているのに機器自体が正常でしたら、AM60Srvrのバグかもしれません。AM60Srvrでパッチ検索してみてください
Y_M
頻繁なアドバイザー

EMS のメッセージについて

すいません。言葉足らずでした。

event.logの内容は下記となります。

Event data from monitor:

Event Time ........:Wed Nov 5 23:40:54 2003

Severity・・・・・・・・・・・:MAJORWARNING

Monitor・・・・・・・・・・・・:fc60mon

Event #・・・・・・・・・・・・:4

System・・・・・・・・・・・・・:XXXXX

Summary:

Disk Array at hardware path :

Array at hardware path Unknown,path Unknown: The computer can not connect to the AM60Srvr.

The status on the disk array is not currently available.

Discription of Error:

This event message is displayed when a connection cqannot be made to the AM60Srvr.

The resource monitor will continue to attempt to

connect to the AM60Srvr at regular polling intervals. When the AM60Srvr is restored,the connection will succeed and normal operation will continue. Until the AM60Srvr is operating normally,it is not possible to obtain the current status of any of the disk arrays.
K_Ta
頻繁なアドバイザー

EMS のメッセージについて



あまりピンとこないのですが、パッチ(HP Array Manager/60 cumulative patch )は適用されていますか?

10.20 PHCO_28165

11.00 PHCO_28166

11.11 PHCO_28167

FC60の状態に問題はありませんか?再度確認をされるのが良いかと思います。

ついでに、diagは新しいバージョンを使用されるのが良いと思います。

Y_M
頻繁なアドバイザー

EMS のメッセージについて

ご回答ありがとうございます。

ただ、上記にてご教授頂いているパッチは既に適用済となっており、また、diagについても新しいバージョンを適用しております。
K_Ta
頻繁なアドバイザー

EMS のメッセージについて



お役にたてませんでした・・・

もう1つ、FC60の"Controller Mode"は"Active"になってますか?

Y_M
頻繁なアドバイザー

EMS のメッセージについて



はい。FC60monの"Contoroller Mode"は"Active"となっ

ております。ちなみに数日に一回、本メッセージが出力される以外は特に問題はでておりません。。。

いろいろ、回答頂きありがとうございます。
sasaki
アドバイザー

EMS のメッセージについて

該当メッセージ中のAdditional Event Data 項目Associated OS error log entry id(s)内にエラーの原因が書かれているかもしれません.

事例としては,

EMFILE (24) errno returned from the catopen system call indicates the per-process descriptor table is full.

が記録されていたケースがあります.

これは,1プロセスあたりのfile descriptorの最大を越えてしまっているためにエラーを記録していることが分かります.

Y_M
頻繁なアドバイザー

EMS のメッセージについて

はい。上記の結果より、lsofにてデータ収集を実施したのですが、結果は120以上のファイルを開いておりました。

(カーネルパラメータではしきい値を120に設定しています。)

ここまでは分かったのですが、では対処はどうすればよいかという部分で行き詰まっております。。。

(カーネルパラメータのしきい値を上げるというのも一つの手かと思うのですが、ただ、今回この事象が発生している装置は全く同構成の装置が他にもあり、その装置では、

本メッセ-ジが出力されていない事より、しきい値云々の

話ではないのかなぁ?と考えています。)
sasaki
アドバイザー

EMS のメッセージについて

一時的には,EMSの再起動を行うことによって,エラーを止めることができると思います.これは,EMSモニターを再起動することによってfile descriptorが開放されるからです.

再起動は,

1. /etc/opt/resmon/lbin/monconfig を実行

2.(K)ill (disable) monitoring #EMSを停止

3.(E)nable Monitoring   #EMSを起動

4.(Q)uit   #monconfigを終了

の手順で行えます.

なぜ別の同構成の装置で発生していないのかは残念ながら分かりませんが,恒久対策としては,仰られるとおり1プロセスあたりの,file descriptorの最大を設定するmaxfilesの値を現在の値より大きくする変更が必要と思われます.(rebootが必要になってしまいますが...)

Y_M
頻繁なアドバイザー

EMS のメッセージについて

いろいろご教授頂きありがとうございます。

EMSの再起動は実施させてもらえるかどうか微妙なところ

ですが、出来れば実施したいと思います。

参考になりました。ありがとうございました。
まつ
アドバイザー

EMS のメッセージについて

ハードに異常はないんですか?

ioscan -fnkの結果を見たいです。

メッセージにハードウェアパスが"unknown"となっていますが、ディスクは使えているのでしょうか・・・?
Y_M
頻繁なアドバイザー

EMS のメッセージについて

真っ先にハードの故障を疑い調査をしたのですが、特に問

題ありませんでした。

(ioscanやamdisp等にて確認しました。)
あかり
アドバイザー

EMS のメッセージについて

環境変数LANGが日本語になっていませんか?

LANG=Cでないと、AM60Srvrは起動できません。

AM60Srvrが起動していないと、Event#4が発生すること

ありますよ。