[MSP-93] 공유디스크 heavy I/O 유발시, SCSI-LOCK 리소스에서 타임아웃으로 장애를 감지

Subject
공유디스크 heavy I/O 유발시, SCSI-LOCK 리소스에서 타임아웃으로 장애를 감지한다.

APPLIES TO:
"MCCS version: 4.0.x
OS: Linux
APPs:
Disk Type: shared"


SYMPTOMS
"1. 리소스는 공유디스크와 SCSI-LOCK 리소스(PR-Type=5) 로 구성
2. 공유디스크에 heavy I/O 유도 (500M를 50개 생성)
3. SCSI-LOCK에서 아래와 같이 장애 감지 2015/02/28-22:29:46.236 | d.RuntimeExecute:319 | DEBUG | /usr/bin/sg_persist -r /dev/emcpowera :TimeoutException
2015/02/28-22:29:46.237 | ration.TargetDisk:96 | ERROR | 940002:명령(/usr/bin/sg_persist -r /dev/emcpowera)이 실패했습니다. 오류코드(-30000) 출력() 을 확인하십시요.
2015/02/28-22:29:46.238 | ate.StateMachine:354 | DEBUG | 10098:S-oradata01 에이전트 상태 변화 : 온라인 -> 정리중, 노드=l-db01
2015/02/28-22:29:46.238 | ate.CleaningState:37 | DEBUG | 10090:S-oradata01 에이전트 정리중 상태에서 정리 요청
2015/02/28-22:29:46.239 | ate.StateMachine:354 | DEBUG | 10098:S-oradata01 에이전트 상태 변화 : 정리중 -> 오프라인, 노드=l-db01
2015/02/28-22:29:46.239 | ate.StateMachine:412 | ERROR | 20041:[l-db01]노드의 리소스 [S-oradata01] 상태 변경. 그룹 [MES_RG]. 타입 [SCSILock]. 상태[FAULTED]. "



CAUSE
"스카시 명령에 대해 기본 런타임 실행 타임아웃(10초)이 적용되고 있다.
모니터링 때 실행하는 스카시 명령(sg_persist)에 타임아웃이 발생하면 장애로 처리하고 있다."

SOLUTION
"스카시 로직에 MonitorTimeout값 적용
FaultOnMonitorTimeout으로 사용자가 장애 감지 패턴을 적용하도록 유도"

Fixed 4.1 Release

 

Filter by label

There are no items with the selected labels at this time.