HP-UX

Service Guard에 관해 질문드립니다.

 
김조운
비정기 기여자

Service Guard에 관해 질문드립니다.

안녕하세요



궁금한 점이 있어 이렇게 질문을 남깁니다.



현재 MCSG A.11.15.00버전을 사용 중이며



패치는 Date: 10/22/03 Patch: PHSS_29901까지 되어있습니다.



Active / Active 로 두개의 오라클 패키지가 구동중이구요





몇 일전 오라클쪽의 ckpt ( check point )데몬이 죽어버려서



다른 쪽 노드로 Fail Over가 일어나는 도중



control.sh의



Function customer_defined_run_cmds인



shutdown immediate에서 더이상 진행되지 않고 멈춰버리는 일이



발생하였습니다.



해당 스크립트의 프로세서를 kill 시키고



오라클을 abort로 내리고 node를 halt하려 시도했지만



node가 halt되지 않았고 reboot 후 다시 정상적으로 node를 추가하여



복구할 수 있었습니다.



오라클쪽에서의 문제는 다른방법으로 분석하고 대처해야할테구요



궁금한 것은



다음에 다시 이런 일이 일어난다면 그때에도 reboot말고는



node를 halt 했다가 run시켜 패키지를 올릴 방법은 없는지요?



그날 command후 메세지를 남겨두지 않아 질문이 좀 두리뭉실한 듯해



죄송스럽네요



고수님들의 조언 부탁드립니다.



감사합니다.

1 응답 1
dae-won kim
조언자

Service Guard에 관해 질문드립니다.

OS가 11.23이라면 일반적인 umount대신 "/sbin/fs/vxfs/vxumount -o force "를 사용하여 프로세서가 비정상태인 상태라 파일시스템 umount가 안되는 경우에도 강제 umount가 가능합니다. 아래는 처음은 정상적으로 umount하고 실패시 위의 명령으로 umount하는 패키지 입니다.



# vi /etc/cmcluster/pkg1/pkg1.cntl



# FILESYSTEM UNMOUNT COUNT

# Specify the number of unmount attempts for each filesystem during package

# shutdown. The default is set to 1.

#FS_UMOUNT_COUNT=1

FS_UMOUNT_COUNT=5



.....

function umount_fs

{

......

if (( $? == 0 ))

then

print "$(date '+%b %e %X') - Node \"$(hostname)\": Unmounting file system on $I"

(

umount ${FS_UMOUNT_OPT} $I; ret=$?

if (( ret != 0 ))

then

print "\tWARNING: Running fuser to remove anyone using the file system directly."

fi



UM_COUNT=$UM_CNT

while (( ret != 0 && UM_COUNT > 0 ))

do

fuser -ku $I

# umount ${FS_UMOUNT_OPT} $I; ret=$?

/sbin/fs/vxfs/vxumount -o force ${FS_UMOUNT_OPT} $I; ret=$?

.......

.......



해당 상황에 도움이 될지 모르겠네요.



추가적으로 클러스터 사용시에 가끔씩 비정상 상태에서 정상 작동 하지 않는 수가 생깁니다. 이런 경우 대부분 oracle running 스크립트를 클러스터 구성에 넣지 않고 사용자가 수작업으로 기동하고 순수하게 볼륨과 Ip정도만 패키지로 등록 합니다.

물론 클러스터 전환시에는 사용자가 개입하여 어플리케이션이 가동이 가능한 환경이어야 하겠지요.