[MIP-242] NIC 장애시 vip가 양서버에서 올라오고, cluster 에서는 RG를 어느쪽으로 자동 온라인하지 못하였음
Subject
NIC 장애시 vip가 양서버에서 올라오고, cluster 에서는 RG를 어느쪽으로 자동 온라인하지 못하였음.
APPLIES TO:
"Windows 2003 Standard(R2 SP2 x86)
MCCS version : r93946
DK 사용
"
SYMPTOMS
"- NIC 오류로 인해, failover 시도 중 NIC가 다시 살아나면서, AutoRestrt 옵션으로 인해 1번서버로 온라인, NIC 오류로 2번에서도 online 시도함
- disk attached 할때, exception 에러
- 담당자는 NIC fail은 났다가 복구 되었는데, 왜 자동으로 서비스가 기동되지 못했는지 설명 요청
- 추측하건데, 안양튼튼병원도 동일한 장애이지 않을까 싶습니다."
CAUSE
"NIC 장애가 발생하여 failover가 진행중이라면 온라인 되어 있는쪽은 offline 시키고 offline 이 끝나면 상대편에 online 시켜라고 명령을 보낸다.
이렇게 failover 진행 중 offline 시키는 쪽이 offline이 아직 다 진행되지 않았는데 NIC장애가 정상이 되었다면 AutoRestart 명령이 큐에 쌓인다.
NIC이 돌아왔고 이것 때문에 AutoRestart와 failover가 둘다 이루어진다.
"
SOLUTION
이런 경우는 상대편 NIC도 정상이 되었기 때문에 그냥 Failover를 계속 진행하는 것이 나을 것 같아서 failover 진행중에는 AutoRestart가 동작하지 않도록 해야 한다. 이것을 Group의 ActionState로 판단했다.
Recovering 이면 failover 진행중이므로 AutoRestart가 무시되도록 수정하였다.
Fixed MCCS 3.3