...
MCCS는 별도 상용 제품인 EMS(Emergency Message Service)를 통해서 해당 시스템의 심각한 오류나 장애가 발생했을 경우, 자동으로 서버 관리자와 MCCS 제품 서비스 담당자에게 문자 메시지를 전송합니다.
또한 웹 기반의 통합 관제 콘솔을 제공함으로써 인터넷을 통하여 언제 어디서든지 장애 현황을 한 눈으로 파악할 수 있으며, 과거의 장애 이력 검색, 관리, 보고서 작성 등을 쉽게 할 수 있습니다.
...
로그 저장
EMS 에이전트가 로그를 저장합니다.
다음과 같은 LogType 속성을 이용하여 EMS 서버에 저장될 로그 종류를 지정할 수 있습니다.
H
HA 관련 로그로 저장됩니다.
(파일감시만 지정 가능합니다.)
A
애플리케이션 관련 로그로 저장됩니다.
(파일감시만 지정 가능합니다.)
S
Windows 시스템 이벤트 로그로 저장됩니다.
(Windows event감시만 지정 가능합니다.)
P
프로세스 관련 로그로 저장됩니다.
(파일감시만 지정 가능합니다.)
로그 분석
EMS 서버 이용자는 EMS 서비스를 받고자 하는 시스템에 대하여 장애 레벨을 설정할 수 있습니다.
EMS 서버는 설정된 장애 레벨을 필터로 사용해서 EMS 에이전트가 실시간으로 전송한 운영 서버의 시스템 로그 및 MCCS 로그를 분석하여 장애 여부를 판단합니다.
...
시스템 담당 운영자 및 MCCS 제품 서비스 담당자는 인터넷 연결이 가능한 곳에서 EMS 서버에 접속하여 장애가 발생한 서버의 로그를 살펴보고 장애 원인을 분석합니다.
또한 제조업 관련 고객사인 경우, EMS 서버를 별도로 구축하면 제품 제조 공정에서 운영되고 있는 수많은 이중화 서버들을 중앙에서 모니터링 할 수 있으며, 통계 정보를 통하여 기간별 장애 유형과 장애 처리 내용들을 검색할 수 있습니다.
다음은 EMS 시스템의 업무 흐름을 도식화 한 것입니다.
...
다음은 EMS 서버에서 제공하는 통합 모니터링 화면의 일부입니다.
장애가 발생한 서버는 붉은 색으로, 장애 발생 후에 서버 관리자가 이를 인지하고 정상화 과정에 있는 서버는 노란색으로 표시되며, 파란색으로 표시된 서버는 정상 상태임을 나타냅니다.
물론 EMS 서버에 등록된 사용자는 해당 사용자가 관리하는 서버에 대해서만 내용을 확인할 수 있습니다.
...
소스 디스크 장애
운영 서버의 미러 디스크 리소스에 장애가 발생하면 MCCS 웹 콘솔에 장애가 표시됩니다.
MCCS는 해당 디스크에 Read/Write가 불가능한 상황이므로 장애로 인식하여 대기 서버로 페일오버를 진행합니다.[그림] 미러 디스크 장애 발생 화면
...
리소스 속성창을 확인합니다.
[그림] 미러디스크 스플릿 브레인 확인미러관리 창을 확인합니다.
[그림] 미러디스크 스플릿 브레인 확인Warning 1)양노드의 MirrorRole은 Source, MirrorState은 MIRROR_PAUSED 상태가 됩니다.
2) 미러디스크의 TimeAquiredSourceRole을 확인합니다. (TimeAquiredSourceRole은 시스템의 시간이므로 최신 데이터의 유무를 결정할 수 있는 절대값은 아닙니다)
3) 스플릿 브레인이 발생했을 때 발생하는 로그가 출력됩니다.
(윈도우즈 이벤트 오류: An invalid attempt to establish a mirror occurred. Both systems were found to be Source.
Local Volume: F Remote system: 200.200.124.49 Remote Volume: F The mirror has been paused, or left in its current non-mirroring state.
Use the DataKeeper User Inteface to resolve this Split Brain condition.)
4) 미러관리 창에서 미러 상태가 'SPLIT' 상태 입니다.- 미러디스크를 선택하고 오른쪽 버튼을 클릭하여 '스플릿 브레인 해결'을 클릭합니다.
[그림] 스플릿 브레인 해결 선택 - 스플릿브레인에 대한 설명창이 출력됩니다.
[그림] 소스 노드 선택에 대한 내용 확인 - 소스노드를 선택합니다.
[그림] 소스 롤 노드 선택 - 선택한 소스노드에 대해 다시 한번 확인합니다.
[그림] 소스 노드 선택 다시 확인 - 스플릿해결 중인 화면입니다.
[그림] 스플릿 브레인 해결 화면 - 스플릿해결 완료 화면입니다.
[그림] 스플릿 브레인 해결 완료 화면 선택한 노드가 소스노드가 되고 미러디스크의 상태는 MIRRORING 상태로 바뀌게 됩니다.
[그림] 스플릿 브레인 해결Warning 노드 B 의 변경된 정보는 모두 덮어써지게 됩니다
...
Windows 2000 이상에서 지원하는 SMB는 Direct-Hosted 방식을 지원합니다. 이 기능은 NetBIOS 인터페이스를 사용하지 않고 직접 파일공유 서비스를 지원합니다.
이름의 IP주소 해결을 위해 DNS 를 통한 조회가 발생하고 NetBIOS 이름해결 절차는 사용되지 않습니다.
...
Windows 서비스에서 Workstation 서비스는 SMB 프로토콜을 사용하여 원격 서버에 대한 클라이언트 네트워크 연결을 만들고 유지합니다.
이 서비스가 중지되면 해당 연결을 사용할 수 없습니다. 이 서비스를 사용하지 않으면 이 연결을 명시적으로 사용하는 다음 서비스를 시작할 수 없습니다.
워크스테이션 서비스를 중지 할때는 주의해야 합니다.
...
Windows 서비스에서 Server 서비스는 이 컴퓨터에 대해 파일, 인쇄 및 명명된 파이프를 네트워크를 통해 공유할 수 있도록 지원합니다.
이 서비스가 중지되면 이런 기능을 사용할 수 없게 됩니다. 이 서비스가 사용할 수 없게 설정되면 이 서비스에 종속성이 있는 다음 서비스는 시작할 수 없게 됩니다.
...
가상이름이 아닌 노드의 원래 NetBIOS 컴퓨터 이름으로 파일공유가 되는지 먼저 확인합니다.
클라이언트에서 dir, start, explorer 또는 net view 명령으로 노드 파일에 정상적으로 접근이 가능한지 확인합니다.
DIR 명령으로 확인합니다.
DIR 명령은 다음의 명령어로 실행합니다.
Code Block |
---|
dir \\virtual_name\shared_folder |
START 명령으로 확인합니다.
START 명령은 다음의 명령어로 실행합니다.
Code Block |
---|
start \\virtual_name |
EXPLORER 명령으로 확인합니다.
EXPLORER 명령은 다음의 명령어로 실행합니다.
Code Block |
---|
explorer \\virtual_name |
NET VIEW 명령으로 확인합니다.
NET VIEW 명령은 다음의 명령어로 실행합니다.
...
컴퓨터의 파일과 인쇄 공유 목록이 생성됩니다. 지정된 컴퓨터에서 사용할 수 있는 파일이나 인쇄 공유가 없으면 "목록에 항목이 없습니다." 메시지가 나타납니다.
페일오버된 상황에서 클라이언트가 갖고 있는 가상이름의 IP주소가 페일오버 전 노드의 주소를 갖는 경우가 발생하면 클라이언트의 NetBIOS 케시가 플러시 될때까지 수 분 동안 통신이 안될 수 도 있습니다.
WINS 서버를 사용하는 경우 이런 상황이 발생 가능합니다 . 따라서 이런 경우 클라이언트 프로그램은 이중화 동작이 발생하는 환경 임을 인지 할 수 있어야 합니다.
...
공유디스크 에이전트와 SCSI Lock 에이전트를 연동할 경우, 공유디스크 에이전트 동작이 정상임을 확인 한 후에 SCSI Lock 에이전트를 등록합니다.
이때 SCSI Lock 에이전트의 디스크 사용목적은 H/W적인 LOCK 장치로 사용하기 위함이지 디스크의 내용을 사용하지는 않습니다.
따라서 디스크의 크기는 작아도 되며 내용은 보호하지 않습니다.
...
scsicmd.cmd -c 옵션 혹은 scsicmd.cmd -cf 옵션 으로 예약키 또는 등록키를 모두 제거한 후 다시 설정해야합니다.
그리고 리소스 등록전에는 등록된 키는 없는지 확인하고 있으면 제거후 등록해야 합니다.
참고로 현재 키는 노드의 MAC 주소를 사용하여 자동으로 설정합니다.
여러개의 네트웍 어탭터중에서 첫 번째 어탭터의 MAC 주소를 사용합니다. 이 키는 설정파일에 자동 기록합니다.
설정파일에 키가 존재할 경우에는 키를 새로 만들지 않습니다.
...
SCS Lock 대상 디스크는 기본 디스크와 단일 레터를 지원합니다.
동적 디스크나 다중 볼륨(하나의 LUN에 여러 파티션을 구성하는 경우)을 사용하는 디스크는 사용하지 마십시요.
...
SCSI Lock 에이전트가 삭제될때 예약을 해제합니다.
따라서 예약대상 공유디스크가 상대 노드에서 사용될 가능성을 염두에 두고 삭제를 해야 합니다.
즉 삭제할 경우에는 상대 노드를 다운시킨 후 작업하십시요.
...
MCCS 에 문제가 생겼을 경우 로그와 환경 정보의 수집을 위해서 서포트 파일을 수집할 수 있습니다.
서포트 파일을 수집하는 방법은 다음과 같이 2가지가 있습니다.
...