Subject
여러개의 RG중 불특정 RG failover 안되는 현상 및 MCCS 에서 batch 실행시 issue
APPLIES TO:
- OS: windows 2008 Std + sp2 (x86)
- Dell R710 장비
- 2011년 4월 26일 package (r.94146)
- 크게 이슈는 2가지임(여러개의 RG중 불특정 RG system failover 안되는 상황과 MCCS에서 batch 실행시 정상 동작 안함 issue
SYMPTOMS
- package 설치
- 설치시, 4EA Resource Group생성 ( 3개의 RG는 NetworkCard 와 복합 응용으로 구성되고, 1개의 RG는 vip, networkcard, 복합응용)
- NIC 및 application failover test 는 정상 동작
- System failover test(OS rebooting) 시, 4개의 Resource Group 중 2개의 Resource Group 이 넘어가지 않음.
- 두번째 TEST를 진행 하였으나, 1개의 Resource Group 이 넘어가지 않음
- Resource Group 을 4개에서 2개로 변경
- 변경 후 failover test 를 진행하였으나, 1개의 Resource Group 이 넘어 가지 않음
- OS를 H/W 버튼을 통해 종료 시, 정상 failover됨
- 이후 3회 재 test시, 정상 failover 됨
- failover 에 대해서 개발부에 문의 하고서 철수 할려고 할 때, application 확인 작업 중, DB에 어떠한 field 값에 lock 이 걸려 있음을 발견.
- DB lock 수정 후 MCCS online 및 offline 등을 하였을 때, DB에 application 이 죽을 때, Act 및 down으로 표시되는 값이 변경되지 않음 확인.
- MCCS 를 배제하고 수동으로 시작 및 중지 하였을 경우, DB에 정상 표시 됨.
- MCCS 에 적용되어 있는 batch 파일을 수동으로 클릭하여 중지 하였을 경우, DB에 정상 표시 됨.
- MCCS 에 적용되어 있는 batch 파일을 command 로 중지 하였을 경우, DB에 정상 표시 됨 확인
- 결론은 MCCS 에서 application 을 중지 할 때, OS 상으로는 정상적으로 중지 되나, 해당 application 이 DB쪽으로 상태 값을 넘겨 주지 못하는 것으로 추정
- application 에 대한 administrator 계정을 MCCS 에서 빼고, 실행시, 정상 동작 하지 않음
- 복합응용으로 구성된 resource 를 기본구성으로 변경시, mother process 만 죽고, child process 는 죽지 않음.
=> 담당자는 mother process 를 죽이면, child process 가 죽는다고 함(기본응용의 MCCS에서 중지할때와, 사용자가 중지할때가 다른 듯 함)
CAUSE
고객사app 스크립트 문제로 판정
SOLUTION
고객사 app 스크립트 변경으로 해결