HP-UX

서버의 네트워크 접속이 주기적으로 죽습니다.

 
sdfsdfd
비정기 기여자

서버의 네트워크 접속이 주기적으로 죽습니다.

서버 모델은 9000/800/L1000-5X 입니다.

서버가 주기적으로 네트워크 접속이 안됩니다. 그래서 rebooting시키면 정상으로 되돌아 오지만 얼마 지나면 다시 똑같은 증상이 되풀이됩니다. 무엇이 문제인지 어떻게 해결해야 하나요?

증상 :

1. /var/adm/syslog/Oldsyslog.log 의 내용을 보면 다음과 같은 메시지가 반복해서 올라옵니다.

Jun 3 19:14:40 tcs022 EMS : ----- EMS Monitor Restart ----- Title: dm_core_hw Command: /usr/sbin/stm/uut/bin/tools/monitor/dm_core_hw Vendor: Hewlett-Packard Company Version: B.01.00 To obtain a list of currently monitored resources, execute the following: /opt/resmon/bin/resdata -M 1998375097



2. /var/tombstones/ 에 ts99 가 생성됨

ts99 의 내용은 다음과 같습니다.

HP-UX tcs022 B.11.00 U 9000/800 1584786577



CPU-ID( Model ) = 0x12

^M

----------------- Processor 0 HPMC Information - PDC Version: 40.48 ------ ^M



* * * No valid timestamp * * *^M

^M

^M

No HPMC chassis codes logged^M

^M

General Registers 0 - 31^M

00-03 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

04-07 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

08-11 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

12-15 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

16-19 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

20-23 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

24-27 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

28-31 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

^M

^M

Control Registers 0 - 31^M

00-03 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

04-07 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

08-11 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

12-15 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

16-19 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

20-23 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

24-27 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

28-31 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

^M

Space Registers 0 - 7^M

00-03 00000000 00000000 00000000 00000000^M

04-07 00000000 00000000 00000000 00000000^M

^M

^M

IIA Space (back entry) = 0x0000000000000000^M

IIA Offset (back entry) = 0x0000000000000000^M

Check Type = 0x00000000^M

CPU State = 0x00000000^M

Cache Check = 0x00000000^M

TLB Check = 0x00000000^M

Bus Check = 0x00000000^M

Assists Check = 0x00000000^M

Assist State = 0x00000000^M

Path Info = 0x00000000^M

System Responder Address = 0x0000000000000000^M

System Requestor Address = 0x0000000000000000^M

^M

^M

Floating Point Registers 0 - 31^M

00-03 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

04-07 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

08-11 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

12-15 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

16-19 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

20-23 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

24-27 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

28-31 0000000000000000 0000000000000000 0000000000000000 0000000000000000^M

^M

^M

Check Summary = 0x0000000000000000^M

Available Memory = 0x0000000000000000^M

CPU Diagnose Register 2 = 0x0000000000000000^M

CPU Status Register 0 = 0x0000000000000000^M

CPU Status Register 1 = 0x0000000000000000^M

SADD LOG = 0x0000000000000000^M

Read Short LOG = 0x0000000000000000^M





-------------- Memory Error Log Information --------------



Bus 0 Log Information





No errors logged for this bus





------------ I/O Module Error Log Information ------------

No I/O module errors logged^M^M

Module Revision

------ --------

System Board A44048

PA 8600 CPU Module 3.1



3 응답 3
김병수
본과생

서버의 네트워크 접속이 주기적으로 죽습니다.

syslog에 있는 다른 장애는 없나요..

tombstone file은 정상으로 보여집니다.



network에 문제가 발생될때

# dmesg

를 확인하여 보시기 바랍니다.



또는,장애가 발생될때 ping은 되나요..



단지 telnet만 되지 않는 것이 라면 kernel parameter를 수정하여여만 합니다.



혹시 모르니 최신의 bundle patch및 PDC firmware 등도 upgrade하여 주시기 바랍니다.



그럼~~~



이태곤
중학생

서버의 네트워크 접속이 주기적으로 죽습니다.

Core 쪽 Lan card 장애일수 있습니다.

님과 같은 증상으로 LanCard을 교체한적이 있습니다.



그리고 ts99는 서버에 이상이 없어도 서버을 재부팅하면 생기는 파일입니다.

고광태
중학생

서버의 네트워크 접속이 주기적으로 죽습니다.

아래의 명령을 실행해보세요..



/opt/resmon/bin/resdata -M 1998375097 조금 짧은듯한데 전체내용을..



그러면 자세하지는 않아도 장애난 포인트를 찾을수가 있습니다.