[MIP-619] 핫빗라인 3개를 5초 이내에 끊고 페일오버된 30초 이내 모든 핫빗 재연결 이후부터 그룹 비정상 동작
Subject
핫빗라인 3개를 5초 이내에 끊고 페일오버된 30초 이내 모든 핫빗 재연결 이후부터 그룹 비정상 동작
APPLIES TO:
"MCCS version: 3.1.9
OS: Windows 2003 R2 x64
APPs: -
Disk Type: -"
SYMPTOMS
"2003 32비트에서는 재현되지 않는 버그
64비트에서 위의 방식대로 구동하면 핫빗 재연결 이후 연결끊은 A노드가 비활성화되며 모든 노드에서 그룹이 오프라인 상태로 나타남. 실제로는 B노드로 페일오버했고 B 노드에서는 온라인임.
이후 그룹활성화를 시키면 ip 리소스가 폴트처리로 나타나고, 폴트를 클리어하면 노드에서의 그룹상태를 재인식함.
그러나, 이후 스위치오버나 오프라인, 온라인 명령이 무시됨.
양쪽노드에서 mccs 서비스를 재시작하면 정상적으로 동작함."
CAUSE
리소스가 탐색 후 그룹에 probe 명령 전달 -> 그전에 flush 명령이 내려짐 -> 그룹 probe 명령 제거 되어 AutoDisabled가 false 로 안바뀜. 따라서 그 이후 온라인 명령 실패
SOLUTION
수동 감지를 사용할 경우 해결될 것으로 보임.