HP-UX

Multibit error관련 문제

 
한세진
조언자

Multibit error관련 문제

안녕하십니까?



한가지 질문이 있어 이렇게 글을 씁니다.



R390에 메모리를 업그레이드 했는데 MC/SG의 package를 올리는 과정에서 reboot이되더군요 확인 해보았더니 뱅크에 2개에 Single/Multi bit error가 있던데 이것이 원인이 되어 그런 것인지 알고 싶습니다.



부탁드립니다.
1 응답 1
양계전
초등학생

Multibit error관련 문제

포럼을 약간 뒤져보면 쉽게 찾으실수 있습니다.



http://hprc.co.kr/qna_view.aspx?q_group=2711&cate=hp-ux



에 고광태님께서 답변을 보시면 이해하실수 있으실듯 합니다



single bit error 가 자주발생하면 메모리를 교체해야합니다.

multi bit error 가 발생한다는것은 시스템이 치명적인 에러를 감지하고 리부팅합니다. 즉 hpmc 가 발생하는거죠. 분석후 파트를 교체해야합니다.



아래의 내용을 참조하세요~



1. PDT 라는 것은 PDC 에 의해서 관리되는 테이블입니다. 메모리 페이지가 한개 또는 그이상의 에러를 가지고있을때 메모리가 deallocated 되었다고 합니다. 그리고 시스템이 패닉이나 corruption 을 피하기 위해서 그 메모리를 더이상 사용하지 않는다는 뜻입니다.



2. 당신은 한개의 엔트리를 가질수있습니다. 그리고 어느날 모두가 crash 될것 입니다. 그리고 당신은 또한 20개의 엔트리들을 가질것입니다. 아무문제없이도 말입니다.

PDT free 가 0 이라면 에러메세지를 많이 뿌리면서 시스템이 제대로 돌아갈수도 잇고 HPMC 가 일어날수도 잇습니다.





3. Memory single bit error 는 시스템이 패리티비트로 체킇서 그것의 문제를 고쳐왔다는것을 의미합니다. 그래서 그것이 발생할때 페이지는 deallocated 된다고 보면 됩니다. 당신이 double bit error 를 가지고 있다면 시스템은 페이지가 deallocated 되어서 crash 될것 입니다.