Subject
service network restart 시 isolation.bat 수행됨
APPLIES TO:
3.5.2
SYMPTOMS
회의때 말씀드린 내용처럼 isolation ip 설정후 service network restart 수행하면 isolation.bat 수행합니다.
default 의 heartbeat timeout을 변경하거나 isolation 설정시 이 부분에 대한 명시가 필요할것 같습니다.
CAUSE
리눅스에서 네트워크 서비스를 리스타트 시키면 , 순간적으로 핫빗 링크가 지정된 시간차를 두지 않고, 모든 연결을 정지한후 재시작한다.
이 모든 연결이 끊어진 시점에 엔진이 isolation테스트를 진행, ping과 hb 이 모드 불가 하므로 , 노드를 재시작한다.
SOLUTION
1.아이솔레이션 테스트 의 수행전에 일정시간을 대기 (일정시간은 네트워크 서비스가 재가동 하는 시간을 추정해서 지정)
>>>네트워크 서비스 리스타트시 성공이나 실패시에 걸리는 시간을 특정할수 없음,
2.아이솔레이션 테스트 전에 네트워크 서비스의 상태가 중지인지, 재기동중인지 확인(리눅스버전만)
>>>네트워크 리스타트 중에 네트워크 stop후 start명령이 진행되는데 개별 이더넷의 up,down만으로 진행되므로 서비스 전체의 스테이터스를 반환하지 않음.
3.메뉴얼에 운용중인 클러스터가 있는 환경에서 ""네트워크 서비스재기동 불가를 메뉴얼등에 명시"".
결론
/var/lock/subsys/network 파일을 기준으로 파일이 존재 할 경우에만 아이솔레션 테스트를 진행 한다.