[MIP-566] 운영서버 네트워크 모두 단절시 Failover는 동작하지만, 운영서버의 공유디스크가 offline이 안되는 현상
Subject
운영서버 네트워크 모두 단절시 Failover는 동작하지만, 운영서버의 공유디스크가 offline이 안되는 현상
APPLIES TO:
MCCS version: 3.6
OS: CentOS release 5.5 (Final) 64bit
APPs:
Disk Type: share
SYMPTOMS
Active 서버의 네트워크 모두 단절시 Failover는 동작하지만, Active 서버의 공유디스크가 offline이 (umount) 안되어 있는 현상.
즉, 공유디스크가 양서버 모두에서 online(mount) 되어 있는 현상.
구성 리소스 dependency는 오라클 차일드에 공유디스크, 가상아이피 두개가 붙어있고, 가상아이피 차일드에 NIC1이 붙은 상황
그리고 Oracle 또는 Nic1네트워크 Failover 테스트에서는 정상 Failover가 동작합니다. 네트워크 모두 단절시에만 위의 이상현상이 발생됩니다.
그리고 구성 리소스 디펜던시가 1자 형태일때는 위의 이상현상이 발생되지 않고, 정상 동작합니다.
CAUSE
운영서버의 모든 네트워크가 단절 될 경우는 클러스터의 각 노드가 서로를 FAULTED(장애) 로 판별합니다.
운영서버에서는 리소스로 구성된 네트워크 카드가 장애이므로 리소스 그룹을 오프라인할 것이고, 대기 서버에서는 운영서버를 장애로 인지하여 리소스 그룹을 온라인 할 것입니다.
이러한 isolation 이 발생할 경우를 막는 방법은 Node 속성의 IsolationTestAddress 속성의 값을 입력하여 실제 isolation 된 서버르 isolation 절차를 밟게 하는 것입니다.
SOLUTION
모든 네트워크 단절시 Node 의 IsolationTestAddress 속성으로 Isolation 을 진행하도록 IP 주소를 입력해 주시면됩니다.