[MSP-93] 공유디스크 heavy I/O 유발시, SCSI-LOCK 리소스에서 타임아웃으로 장애를 감지

Subject
공유디스크 heavy I/O 유발시, SCSI-LOCK 리소스에서 타임아웃으로 장애를 감지한다.

APPLIES TO:
"MCCS version: 4.0.x
OS: Linux
APPs:
Disk Type: shared"

SYMPTOMS
"1. 리소스는 공유디스크와 SCSI-LOCK 리소스(PR-Type=5) 로 구성
2. 공유디스크에 heavy I/O 유도 (500M를 50개 생성)
3. SCSI-LOCK에서 아래와 같이 장애 감지 2015/02/28-22:29:46.236 | d.RuntimeExecute:319 | DEBUG | /usr/bin/sg_persist -r /dev/emcpowera :TimeoutException
2015/02/28-22:29:46.237 | ration.TargetDisk:96 | ERROR | 940002:명령(/usr/bin/sg_persist -r /dev/emcpowera)이 실패했습니다. 오류코드(-30000) 출력() 을 확인하십시요.
2015/02/28-22:29:46.238 | ate.StateMachine:354 | DEBUG | 10098:S-oradata01 에이전트 상태 변화 : 온라인 -> 정리중, 노드=l-db01
2015/02/28-22:29:46.238 | ate.CleaningState:37 | DEBUG | 10090:S-oradata01 에이전트 정리중 상태에서 정리 요청
2015/02/28-22:29:46.239 | ate.StateMachine:354 | DEBUG | 10098:S-oradata01 에이전트 상태 변화 : 정리중 -> 오프라인, 노드=l-db01
2015/02/28-22:29:46.239 | ate.StateMachine:412 | ERROR | 20041:[l-db01]노드의 리소스 [S-oradata01] 상태 변경. 그룹 [MES_RG]. 타입 [SCSILock]. 상태[FAULTED]. "

CAUSE
"스카시 명령에 대해 기본 런타임 실행 타임아웃(10초)이 적용되고 있다.
모니터링 때 실행하는 스카시 명령(sg_persist)에 타임아웃이 발생하면 장애로 처리하고 있다."

SOLUTION
"스카시 로직에 MonitorTimeout값 적용
FaultOnMonitorTimeout으로 사용자가 장애 감지 패턴을 적용하도록 유도"

Fixed 4.1 Release

MCCS Service Desk Knowledge Base

[MSP-93] 공유디스크 heavy I/O 유발시, SCSI-LOCK 리소스에서 타임아웃으로 장애를 감지

Related articles

Filter by label