/
[MIP-266] relocate 도중 shared disk 쪽 exception 발생 되므로써, 양 쪽 node에 resource들이 실행할려고 시도함

[MIP-266] relocate 도중 shared disk 쪽 exception 발생 되므로써, 양 쪽 node에 resource들이 실행할려고 시도함

Subject
relocate 도중 shared disk 쪽 exception 발생 되므로써, 양 쪽 node에 resource들이 실행할려고 시도함.

APPLIES TO:
storage 구성
MSSQL
windows 2003
MCCS 3.1


SYMPTOMS
RG는 양 노드에서 start 할려고 하였고, 1번노드는 ip 및 disk attach를 시도 하려고 한 상태이며,
2번 노드는 vip, disk , mssql 서비스, 및 was 쪽 1EA 의 서비스가 실행되고 있었음.

CAUSE
먼저 공유디스크의 online 시도시 정말 장애가 발생한 것은 아니라 약간의 delay가 있었는데 이때문에 success return값을 제때 못받아 agent에서 장애로 처리하였습니다.
빨간색 위의 사각형에 보면 2번째 노드에서 온라인시도 후 예외발생으로 장애처리하였고 다시 failback 하게 됩니다. 밑의 사각형에서 보면 1번째 노드로 페일오버를 시도 하는데 갑자기 디스크 에이전트가 온라인이 되어버립니다. 그러면서 2번 노드의 그룹 상태도 faulted에서 partial로 변해버립니다.
현재는 이렇게 온라인시 약간의 delay time에 대한 처리를 보완 중입니다.


SOLUTION
디스크를 온라인 시킨 후 일정시간 동안(현재는 최대 5초) 모니터링을 하여 정상적인 온라인상태인지 아닌지를 체크 하도록 수정함.
Fixed MCCS 3.2

 

Related content

[MIP-222] MVL 오류로 shared disk를 online 되지 않음
[MIP-222] MVL 오류로 shared disk를 online 되지 않음
More like this
[MIP-171] MCCS 사용중 라이선스 이상으로 Relocate 실패함
[MIP-171] MCCS 사용중 라이선스 이상으로 Relocate 실패함
More like this
[MIP-555] 에이전트가 비활성(Detached) 상태인 리소스의 상태가 OFFLINE 나타남
[MIP-555] 에이전트가 비활성(Detached) 상태인 리소스의 상태가 OFFLINE 나타남
More like this
[MIP-344] 과다한 I/O가 발생하는 상황에서 "30048:NIC의 상태를 파악 할 수 없습니다. 오류 번호: -55" 로그가 발생
[MIP-344] 과다한 I/O가 발생하는 상황에서 "30048:NIC의 상태를 파악 할 수 없습니다. 오류 번호: -55" 로그가 발생
More like this
[MSP-97] 공유디스크 온/오프라인 무한 팬딩 상태 원인 분석 요청
[MSP-97] 공유디스크 온/오프라인 무한 팬딩 상태 원인 분석 요청
More like this
[MIP-624] 핫빗 최초 구성 시 핫빗 포트를 변경하면 서버 연결에 실패한다
[MIP-624] 핫빗 최초 구성 시 핫빗 포트를 변경하면 서버 연결에 실패한다
More like this