Subject
서비스 리소스 복구시도가 정상적으로 되지 않은 원인 분석않음
APPLIES TO:
MCCS version: MCCS 3.6.1 DK7.5
OS: Windows 2008 R2 STD + SP1
APPs: Tomcat + 고객사 자체 APP(WowzaMediaServer362)
-> 모두 서비스 리소스
Disk Type:
SYMPTOMS
1. DISA_MCS3 노드에서 WowzaMediaServer362가 오프라인되면서 restartlimit 설정값으로 인해 RESOURCE_RESTART 명령으로 온라인 시도함.
이때 DISA_MCS4 노드에서 온라인 시도가 발생됨. DISA_MCS4 노드에서 WowzaMediaServer362이 온라인 된상태.
-> DISA_MCS4서버의 System log 확인해보고 WowzaMediaServer362서비스 시작됨으로 변경 일시 확인해보겠습니다
2. DISA_MCS4 노드에서 DISA_MCS3 노드보다 빠르게 WowzaMediaServer362 리소스 온라인 시킴.
-> 이 말씀은 이해가가지 않습니다
3. DISA_MCS3 노드에서는 RESOURCE_RESTART 명령으로 인해 process를 동작 시키려고함.
-> process가 아니라 서비스 리소스입니다
4. DISA_MCS3 노드에서 ""30013:DISA_RG 그룹은 parallel 이 서비스 리소스가 종료되어 재시작을 시도하였으나 "병렬그룹이 아님. 다른 노드에서 동작중인 리소스가 존재함" " 찍으며 온라인 실패함.
5. DISA_MCS3 온라인이 될때까지 대기하지만 온라인이 되지 않아 timeout 발생하며 ERROR 리턴. 로그와 함께 타임아웃까지 대기한 후 실패
CAUSE
DISA_MCS4노드의 MCCS에서의 로그를 보면, 아래와 같이 partial 로 누군가 Tomcat7을 띄우려고 한 부분을 MCCS가 감지한 로그가 출력(병렬실행 하려함)
SOLUTION
타이밍상 RESOURCE_RESTART 명령이 들어갈때 원격 노드에서 Tomcat7이 online 상태로 된걸 감지한다면
로컬 노드에서"" WARN DISA_RG 그룹은 parallel 이 병렬그룹이 아님. 다른 노드에서 동작중인 리소스가 존재함"" 로그를 발생시키면서
restart하는데 재시작하는데 문제가 있음/.
Related articles
Filter by label (Content by label) | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
...