...
- 복제 네트워크 장애 복제 네트워크에 장애가 발생하면 데이터 복제를 진행할 수 없으며, MCCS 콘솔의 미러 디스크 리소스 부분이 'Pause' 상태로 표시 됩니다.
[그림] 복제 네트워크 장애 발생 화면
...
- 단일 네트워크 스위치 장애 단일 네트워크 스위치로 구성된 환경에서 Public Network에 연결된 네트워크 스위치에 장애가 발생하면 운영 서버 및 대기 서버의 모든 그룹 리소스가 오프라인이 되며, 장애가 발생한 리소스는 '장애' 상태로 표시 됩니다.
[그림] 네트워크 스위치 장애 발생 화면
- 네트워크 스위치 장애는 MCCS 로그, 윈도우 시스템 로그에서 장애 내역을 확인할 수 있습니다.
서버 관리자는 케이블 연결 상태 및 ping 테스트를 통해 해당 네트워크 스위치 상태 및 네트워크 연결 상태를 확인하고 장애 원인을 제거해야 합니다. - 자동으로 장애 표시를 제거하려면 그룹 속성의 AutoFaultClearTime에 0보다 큰 값을 설정하면 됩니다.'자동 장애표시제거'에 대한 상세한 내용은 "챕터 9. 속성 - 그룹 속성값" 편을 참조해 주십시오.
- 네트워크 스위치 장애에 대한 복구는 해당 제조사를 통하여 지원 받으시기 바랍니다.
...
- 소스 디스크 장애 운영 서버의 미러 디스크 리소스에 장애가 발생하면 MCCS GUI에 장애가 표시됩니다. MCCS는 해당 디스크에 Read/Write가 불가능한 상황이므로 장애로 인식하여 대기 서버로 페일오버를 진행합니다.
[그림] 미러 디스크 장애 발생 화면
- MCCS에서 디스크에 대한 장애 감지 방식은 다음과 같습니다.
- 해당 디스크에 대해서 Read/Write를 실행합니다.
- 해당 디스크의 드라이브 문자가 있는지 없는지를 판단합니다.
- 디스크 장애 발생 요인은 다음과 같은 경우가 있을 수 있습니다. 위의 문제가 해결 된 후에 운영 체제는 변경된 디스크를 다시 인식합니다.이후 DataKeeper에서 동기화를 진행합니다.
- 디스크 컨트롤러 문제 하드웨어 자체의 문제는 해당 업체에서 해결해야 합니다.
- 물리적인 디스크 문제 하드웨어 자체의 문제는 해당 업체에서 해결해야 합니다.
- 단, DataKeeper에서 동기화가 진행되지 않으면 job을 삭제한 후에 다시 생성해야 합니다. 이전과 동일한 job을 생성한다면 MCCS의 미러 디스크 리소스를 수정할 필요는 없습니다.
- DataKeeper에서 데이터 동기화 과정 및 job 생성에 관한 상세한 내용은 "DataKeeper 사용자 안내서 및 설치 안내서"를 참조해 주십시오.
- 타깃 디스크 장애 대기 서버의 디스크에 장애가 발생하면 MCCS GUI의 디스크 리소스 아이콘에 'Pause'가 표시됩니다. 그러나 소스 서버에서 운영중인 서비스에는 영향을 미치지 않습니다.
[그림] 타깃 디스크 장애 발생 화면
- MCCS에서 타깃 디스크에 대한 장애 감지는 해당 디스크의 드라이브 문자가 있는지 없는지 만을 판단합니다.
- 디스크 장애 발생 요인은 다음과 같은 경우가 있을 수 있습니다.위의 문제가 해결 된 후에 운영 체제는 변경된 디스크를 다시 인식합니다.이후 DataKeeper에서 동기화를 진행합니다.
- 디스크 컨트롤러 문제 하드웨어 자체 문제는 해당 업체에서 해결해야 합니다.
- 물리적인 디스크 문제 하드웨어 자체 문제는 해당 업체에서 해결해야 합니다.
- 단, DataKeeper에서 동기화가 진행 되지 않으면 job을 삭제한 후에 다시 생성해야 합니다. 이전과 동일한 job을 생성한다면 MCCS의 미러 디스크 리소스를 수정할 필요는 없습니다. (DataKeeper에서의 데이터 동기화 과정 및 job 생성에 관한 상세한 내용은 "DataKeeper 사용자 안내서 및 설치 안내서"를 참조해 주십시오.)
...
미러 디스크 리소스의 Split Brain
매우 드문 경우이지만 두 서버상에서 미러 디스크 역할이 모두 소스로 인식되는 경우입니다.
이러한 상황은 타깃이 소스로 변경되는 시점에 기존 소스가 타깃으로 변경되지 못한 결과이며, 이 때는 서로 자신의 데이터를 동기화하려 하지만 데이터를 받는 상대 서버 역시 자신이 소스 서버인 상태이므로 역할 변경을 거부하게 됩니다.
...
미러 디스크 역할을 수동으로 변경하는 방법은 MCCS 콘솔을 이용하면 됩니다.
...
<MCCS UI을 사용해서 미러디스크의 롤을 변경하는 방법
...
스플릿브레인을 해결하는 방법>
리소스 속성창을 확인합니다.
[그림] 미러디스크 스플릿 브레인 확인미러관리 창을 확인합니다.
Warning 1) 미러디스크가 스플릿 브레인이 발생하여 양노드의 MirrorRole은 Source, MirrorState은 MIRROR_PAUSED 상태가 됨됩니다.
2) 미러디스크의 LastMirrorOnlineTime TimeAquiredSourceRole을 확인합니다. (LastMirrorOnlineTimeTimeAquiredSourceRole은 시스템의 시간이므로 최신 데이터의 유무를 결정할 수 있는 절대값이 절대값은 아닙니다)
3) 스플릿 브레인이 발생했을 때 발생하는 로그
추가적으로, 아래의 에러로그가 시스템 이벤트 로그에 보이게 됩니다.
Code Block An invalid attempt to establish a mirror occurred. Both systems were found to be Source. Local Volume: F Remote system: 192.168.1.212 Remote Volume: F The mirror has been paused or left in its current non-mirroring state.
로그가 출력됩니다. (윈도우즈 이벤트 오류: An invalid attempt to establish a mirror occurred. Both systems were found to be Source. Local Volume: F Remote system: 200.200.124.49 Remote Volume: F The mirror has been paused, or left in its current non-mirroring state. Use the DataKeeper User Inteface to resolve this Split Brain condition.)
4) 미러관리 창에서 미러 상태가 'SPLIT' 상태 입니다.
- 미러디스크를 선택하고 오른쪽 버튼을 클릭하여 '스플릿 브레인 해결메뉴에 커서를 위치하면 소스로 지정할 노드를 선택할 수 있게 됩니다해결'을 클릭합니다.
[그림] 소스 롤 노드 선택 - 노드를 선택하면 다시 한번 확인하는 팝업메뉴가 보입니다스플릿브레인에 대한 설명창이 출력됩니다.
[그림] 소스 롤 노드 확인 - 확인을 선택하면 원격노드는 타겟 롤로 변경됩니다.
[그림] 스플릿 브레인 해결 - 미러디스크의 미러링이 재개되면, PARTIAL_RESYNC 가 발생하게 되고 미러디스크의 상태는 MIRRORING 상태로 바뀌게 됩니다.
- 소스노드를 선택합니다.
- 선택한 소스노드에 대해 다시 한번 확인합니다.
- 스플릿해결 중인 화면입니다.
- 스플릿해결 완료 화면입니다.
선택한 노드가 소스노드가 되고 미러디스크의 상태는 MIRRORING 상태로 바뀌게 됩니다.
[그림] 스플릿 브레인 해결Warning 노드 B 의 변경된 정보는 모두 덮어써지게 됩니다
...