...
Section | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
...
운영중인 응용프로그램 리소스에 대하여 MCCS는 다음과 같은 4가지 요소에 의해 동작을 하게 됩니다.
- MonitorInterval (기본값=10초)
설정된 값을 주기로 리소스를 감시합니다. - MonitorTimeout (기본값=10초)
MonitorTimeout 설정된 값 만큼 응답이 오지 않으면 장애로 판단합니다. - RestartLimit (기본값=10초0)
RestartLimit 설정된 값만큼 해당 응용프로그램 리소스를 재시작합니다. - OnlieTrustTime (기본값=0600초)
OnlieTrustTime 리소스 재시작 횟수를 재설정하는 시간입니다. (기본값=600초)
위의 속성값들은 해당 리소스를 등록할 때 설정된 값이고, 사용자는 각 리소스의 속성 페이지를 통하여 값을 수정하거나 확인할 수 있습니다.
[그림] 리소스 속성값 수정 화면
...
Warning |
---|
※ MCCS 라이선스는 MAC 어드레스를 참조하기 때문에 네트워크 카드가 변경되면 라이선스를 재발급 받아야 합니다. |
- 서비스 네트워크 장애
운영 서버에서 서비스 네트워크 장애가 발생하면 MCCS UI의 네트워크 주소 또는 네트워크 카드 리소스부분에 장애 표시가 되고 대기 서버로 페일오버를 진행합니다.
[그림] 네트워크 카드 장애 표시 화면
- 서비스 네트워크 장애는 장애가 발생한 부분을 MCCS UI 창에서 확인할 수 있습니다.
- MCCS는 네트워크 장애가 발생된 서버의 네트워크 케이블 단절 또는 특정 네트워크로의 Ping 타임아웃 발생 유무를 확인합니다.
- 네트워크 주소 리소스가 장애 원인이라면 사용자는 네트워크 스위치 또는 네트워크 카드부터 점검해야 합니다. 네트워크와 관련된 물리적인 부분들이 정상화 된 후에는 MCCS 콘솔에서 '장애표시제거' 메뉴를 선택하여 장애 표시 항목을 제거합니다. 이 때부터는 페일오버가 가능한 상태가 됩니다.
- 자동으로 장애 표시를 제거하려면 그룹 속성의 AutoFaultClearTime에 0보다 큰 값을 설정하면 됩니다.
- 핫빗 네트워크 장애
핫빗은 노드 상호간의 상태를 동기화하고 장애 상태를 결정하는 중요한 역할을 하기 때문에 반드시 이중화되어 있어야 합니다. 이중화된 핫빗 네트워크 중에서 어느 하나라도 장애가 발생하면 장애 내용은 로그창에 표시 됩니다.
하지만 MCCS GUI 부분에는 아무런 변화가 나타나지 않습니다. 이것은 운영 서버와 대기 서버에는 아무런 문제가 없다는 것을 뜻합니다.
이 때, 운영 서버에 문제가 생겨 대기 서버로 페일오버 해야 할 상황이 발생하면 MCCS는 장애가 발생하지 않은 정상적인 핫빗 네트워크를 이용하여 페일오버를 진행하게 됩니다.
만일 이중화된 핫빗 모두가 단절된 상황이라면 MCCS는 서비스 네트워크를 이용하여 핫빗 통신을 하게 됩니다.
[그림] 핫빗 장애 발생 화면
- 핫빗 장애는 MCCS 로그, 윈도우 시스템 로그에서 장애 내역을 확인할 수 있습니다.
핫빗 장애가 발생하면 서버 관리자는 서버의 TCP/IP, 물리적인 연결 상태 및 ping 테스트를 통해 핫빗이 정상적인 상태인지를 확인해야 합니다. - 만약 비정상적인 상황이라면 카드 불량, 케이블 연결 불량 혹은 케이블 단선 등을 확인하고 장애 원인을 제거해야 합니다.
- 복제 네트워크 장애
복제 네트워크에 장애가 발생하면 데이터 복제를 진행할 수 없으며, MCCS 콘솔의 미러 디스크 리소스 부분이 'Pause' 상태로 표시 됩니다.
[그림] 복제 네트워크 장애 발생 화면
- 복제 네트워크 장애는 MCCS 로그, 윈도우 시스템 로그에서 장애내역을 확인할 수 있습니다. 복제 네트워크 장애가 발생하면 서버 관리자는 서버의 TCP/IP, 물리적인 연결상태 및 ping 테스트를 통해 복제 네트워크가 정상적인 상태인지를 확인해야 합니다.
- 만약 비정상적인 상황이라면 카드 불량, 케이블 연결 불량 혹은 케이블 단선 등을 확인하고 장애 원인을 제거해야 합니다.
- 단일 네트워크 스위치 장애
단일 네트워크 스위치로 구성된 환경에서 Public Network에 연결된 네트워크 스위치에 장애가 발생하면 운영 서버 및 대기 서버의 모든 그룹 리소스가 오프라인이 되며, 장애가 발생한 리소스는 '장애' 상태로 표시 됩니다.
[그림] 네트워크 스위치 장애 발생 화면
...
미러 디스크 장애 (내장 스토리지)
- 소스 디스크 장애
운영 서버의 미러 디스크 리소스에 장애가 발생하면 MCCS GUI에 장애가 표시됩니다. MCCS는 해당 디스크에 Read/Write가 불가능한 상황이므로 장애로 인식하여 대기 서버로 페일오버를 진행합니다.
[그림] 미러 디스크 장애 발생 화면
- MCCS에서 디스크에 대한 장애 감지 방식은 다음과 같습니다.
- 해당 디스크에 대해서 Read/Write를 실행합니다.
- 해당 디스크의 드라이브 문자가 있는지 없는지를 판단합니다.
- 디스크 장애 발생 요인은 다음과 같은 경우가 있을 수 있습니다. 위의 문제가 해결 된 후에 운영 체제는 변경된 디스크를 다시 인식합니다.이후 DataKeeper에서 동기화를 진행합니다.
- 디스크 컨트롤러 문제 하드웨어 자체의 문제는 해당 업체에서 해결해야 합니다.
- 물리적인 디스크 문제 하드웨어 자체의 문제는 해당 업체에서 해결해야 합니다.
- 단, DataKeeper에서 동기화가 진행되지 않으면 job을 삭제한 후에 다시 생성해야 합니다. 이전과 동일한 job을 생성한다면 MCCS의 미러 디스크 리소스를 수정할 필요는 없습니다.
- 타깃 디스크 장애
대기 서버의 디스크에 장애가 발생하면 MCCS GUI의 UI의 디스크 리소스 아이콘에 'Pause'가 표시됩니다. 그러나 소스 서버에서 운영중인 서비스에는 영향을 미치지 않습니다.
[그림] 타깃 디스크 장애 발생 화면
...
가상이름이 아닌 노드의 원래 NetBIOS 컴퓨터 이름으로 파일공유가 되는지 먼저 확인합니다.
클라이언트에서dir클라이언트에서 dir, start, explorer 또는 net view 명령으로 노드 파일에 정상적으로 접근이 가능한지 확인합니다.
...
페일오버된 상황에서 클라이언트가 갖고 있는 가상이름의 IP주소가 페일오버 전 노드의 주소를 갖는 경우가 발생하면 클라이언트의 NetBIOS 케시가 플러시 될때까지 수 분 동안 통신이 안될 수 도 있습니다. WINS 서버를 사용하는 경우 이런 상황이 발생 가능합니다 . 따라서 이런 경우 클라이언트 프로그램은 이중화 동작이 발생하는 환경 임을 인지 할 수 있어야 합니다.
SCSI
...
Lock 장애
SCSI3-PR 을 사용하는 볼륨매니저와 연동할 때
...
하나의 디스크에 여러 레터가 존재할 경우 한개의 레터에 예약 시 나머지에 레터에 접근을 못할 때
SCSI SCS Lock 대상 디스크는 기본 디스크와 단일 레터를 지원합니다. 동적 디스크나 다중 볼륨(하나의 LUN에 여러 파티션을 구성하는 경우)을 사용하는 디스크는 사용하지 마십시요.
...
서포트 파일을 수집하는 방법은 다음과 같이 2가지가 있습니다.
...
UI 통해서 수집하는 방법
- MCCS의 메뉴바의 '파일'에서 서포트 파일을 수집할 수 있습니다.
[그림] 메뉴바에서 서포트 파일 수집 - MCCS의 툴바 아이콘을 클릭하면 서포트 파일을 수집할 수 있습니다.
[그림] 툴바에서 서포트 파일 수집 - 서포트 파일을 수집할 노드의 선택과 이전에 받은 서포트파일을 다시 받을 수 있습니다.
[그림] 서포트 파일 노드 선택 및 이전 서포트 파일 선택 여부 확인 버튼을 누르면 서포트 파일을 수집합니다.
[그림] 서포트 파일 수집 중 화면Info 로그파일의 용량과 네트워크의 상태에 따라서 몇 분이 걸릴수도 있습니다.
- 아래와 같이 다운로드 창이 열리게 되고 다운받으시면 됩니다.
[그림] 서포트 파일 수집 확인
...