HP-UX

dmesg의 내용분석부탁드립니다..

 
권규용
정기 조언자

dmesg의 내용분석부탁드립니다..

1.dmesg

emcp:Mpc:Info: Volume 6006016029E1100016FA1626E9B2D811 uses active SPB

emcp:Mpc:Info: Volume 6006016029E11000CA37513891B3D811 uses active SPB

emcp:Mpc:Info: Volume 6006016029E11000B4C32B6A91B3D811 uses active SPB

emcp:Mpc:Info: Volume 6006016029E11000A487BF8092B3D811 uses active SPB

emcp:Mpc:Info: Volume 6006016029E11000CCE1CA8E92B3D811 uses active SPB

emcp:Mpc:Info: Volume 6006016029E11000C658109C92B3D811 uses active SPB

emcp:Mpc:Info: Volume 6006016029E11000A48147A992B3D811 uses active SPB

DIAGNOSTIC SYSTEM WARNING:

The diagnostic logging facility has started receiving excessive

errors from the I/O subsystem. I/O error entries will be lost

until the cause of the excessive I/O logging is corrected.

If the diaglogd daemon is not active, use the Daemon Startup command

in stm to start it.

If the diaglogd daemon is active, use the logtool utility in stm

to determine which I/O subsystem is logging excessive errors.

SCSI: Reset requested from above -- lbolt: 7139618, bus: 4

SCSI: Resetting SCSI -- lbolt: 7139718, bus: 4

SCSI: Reset detected -- lbolt: 7139718, bus: 4

DIAGNOSTIC SYSTEM WARNING:

The diagnostic logging facility is no longer receiving excessive

errors from the I/O subsystem. 9 I/O error entries were lost.





2.또한가지 더여...

clustering 되어있는 A, B서버 에서요...Secondary B 서버의

rebooting시에 왜 filesystem 일부가 mount가 되질 않고 다음과

같은 message(rc.log)가 보여집니다..

----------------------------------------------

mountall: cannot mount /dev/vg16/lvol1

mountall: diagnostics from mount

mount - Cannot open /dev/vg16/lvol1: No such device or address



mountall: cannot mount /dev/vg15/lvol2

mountall: diagnostics from mount

mount - Cannot open /dev/vg15/lvol2: No such device or address



mountall: cannot mount /dev/vg15/lvol1

mountall: diagnostics from mount

mount - Cannot open /dev/vg15/lvol1: No such device or address

----------------------------------------------

이상하죠? /etc/lvmtab 파일과 /etc/fstab파일을 봐도 정상적이죠..



어쩔수 없이 vgchange 로 Activate 한 후 mount -a 하면 다 올라옵니다.



꼭좀 부탁드립니다.....
4 응답 4
고광태
중학생

dmesg의 내용분석부탁드립니다..

현재 자동으로 특정볼륨들에 대해서 active 가 안되는것 같네요..



결국 안되는 이유가 1번질문에 나와 있는 듯 하네요



제생각에는 lock disk 에 문제가 있는듯한데요..



서로 ownership 을 주고 받을수있도록 되어야 하는데..



서로 가져갈려고 하기때문에 발생되는 에러인듯하네요..



제생각입니다. 그쪽도 체크해보시기 바랍니다.



이연주
정기 조언자

dmesg의 내용분석부탁드립니다..

안녕하십니까.



두 번째 질문의 경우는



혹시 mount가 안된 Volume들이 클러스터에서 shared 되는 볼륨들인가요? 그리고 서버 B에는 package(서비스)가 running중인가요?

만약에 mount시 에러난 볼륨들이 package가 running중이고 그 package가 access하는 볼륨이라면 B 서버가 서버 A로 take over가 발생하고

그렇게 되면은 B에서 실행되던 package는 A 서버에서 실행되고 access 하던 볼륨들은 A에서 active되고 파일 시스템들이 mount가 됩니다.

이때 B의 경우 shared volume들은 deactivation이 됩니다.



그러므로 B 서버에서 부팅시 /etc/fstab 파일에 등록되어 있는 파일 시스템들은 볼륨 그륩이 deactivation이 되어 있으니까 mount가 안되겟죠...



자세히는 모르겟지만 혹시 이런 문제는 안진지 모르겟네요.







권규용
정기 조언자

dmesg의 내용분석부탁드립니다..

두분다 감사드립니다..

제 질문을 정리해보면

1.dmesg 내용은 clustering 된 A서버의 내용입니다..

2.rc.log 내용은 clustering 된 B서버의 내용입니다..



제가 했던 절차를 설명드리면



그전날..A서버를 rebooting할때도 mount가 일부 되질 않았습니다..

이때 B서버는 운영중에 있었죠..

그래서 A서버에서 pkg를 올리는데 Error가 나더군요..

vgchange한 후 mount를 시켰습니다..정상적으로 올라오더군요..



그리고 오늘 B서버를 rebooting했습니다...

그랬더니 위의 2번과 같은 log가 나오면서 mount되질 안더군요..



아무래도 제가 clustering에 대한 shutdown절차를 올바로 수행하지

못한 결과가 아닌가 생각됩니다....절차좀 갈켜 주십시요..



저는 clustering에 대해 잘 모릅니다...

답변 부탁드립니다.....꾸벅
이연주
정기 조언자

dmesg의 내용분석부탁드립니다..

안녕하십니까.



서버를 재부팅 하실려면



먼저 재부팅 하실려는 서버에서



# cmhaltpkg pakcage_name



하셔서 package를 내리십시오.



# cmrunpkg -n node_name package_name

하셔서 다른 node에서 package를 실행하십시오.



그리고



# cmhaltnode node_name



하셔서 cluster에서 해당 node를 제거합니다.



그다음 재부팅 하시고 올라오면



# cmrunnode node_name



하시면 해당 node가 다시 cluster에 조인됩니다.



그리고

# cmviewcl -v



하셔서 cluster와 package 상태를 확인하십시오.



그리고 package를 다시 join된 서버로 실행하십시오.



# cmrunpkg -n node_name package_name





다음에

# cmviewcl -v

하셔서 확인하시기 바랍니다.



그리고 # cmhaltcl -f 하시면 클러스터가 내려가고



# cmruncl -v



하시면 클러스터가 다시 올라갑니다.



클러스터에 join되어 있는 node들을 계획적인 downtime을 가지실려면



package를 모두 내리고 클러스터도 내리시고 작업하십시오.