Subject
MCCS Agent 재시작 했을시 MCCS 콘솔 접속이 불가
APPLIES TO:
MCCS version: 3.3.2
OS: Windows server 2008 R2 x64 Standard Edition SP1
APPs:
Disk Type: shared
SYMPTOMS
- 1번서버에서 운영중인 서비스를 스토리지(SAN) 를 자기가 잘못건드려서 1번서버를 강제재부팅후 2번으로 서비스를 넘김
- 2번서버에서 정상 운영중인 상태이며, 2번서버에서 MCCS 콘솔상에서는 2번에 정상 운영중이었으나, 1번서버 쪽으로 가서 MCCS 콘솔을 보니 양서버 노드 가 모두 서비스되지 않은상태(아이콘이 모두 흑백)
- 그래서 1번서버 MCCS Agent 중지, 2번서버 MCCS Agent 중지, 2번서버 MCCS agent 시작, 1번서버 MCCS Agent 시작 하였는데 콘솔이 접속이 안됨
- 2~3차례 동일 방법으로 시도 했지만, 역시 MCCS 콘솔접속이 안되었고, 그러는 동안 양쪽서버 공유드라이브에 락이 걸린거 같고, 그래서 서비스가 잠깐동안 (약4분정도) 중단
CAUSE
1. 부팅된 노드의 MCCS 콘솔에서는 그룹이 오프라인 이었다.
- 원인은 1번 서버 재부팅 후 2번 서버와 합류할 때 "원격 빌드" 상태가 되어야 하는데 ""로컬 빌드"" 로 진행이 되면서 원격 노드의 리소스 상태가 업데이트 되지 않았습니다.
이 문제는 MCCSKEY-1498 에서 해결되었습니다. (FixVersion 3.4)
추가적인 이슈가 또 있네요. MCCSKEY-1229 (FixVersion 3.4)
2. 2번 노드의 MCCS Agent Service 를 재시작 하였고, Shared Disk 에 Lock 이 걸렸다
- BootMode 로 판단하여 공유디스크에 Lock.
3. MCCS 서비스 restart 시, 정상적으로 합류가 안 되었다.
- MCCSKEY-1300, MCCSKEY-1430 으로 해당 로직 부분이 강화되었습니다.
- MCCSKEY-1498 이 원인입니다. (FixVersion 3.4)
4. BootMode 오판.
- BootMode 로 판단한 것에 대해서는 추가적인 디버그로그를 삽입해서 릴리즈 해야 할 것 같습니다.
SOLUTION
Fixed 3.5.3