...
- 대기 서버에 장애가 발생하면 MCCS는 해당 서버에 장애 발생을 표시합니다.
- 대기 서버가 정상화 되기 전까지 데이터 복제를 잠시 중단합니다.
[그림] 대기 서버 장애 발생 화면 - I/O가 계속 발생된다면 데이터 동기화가 불가능해지고 미러 디스크가 'Pause' 상태(아이콘 표시 변경)가 됩니다.
- 만일, I/O 발생이 없다면 미러 디스크의 아이콘 부분에 아무런 변화가 나타나지 않지만 MCCS 로그 창에는 미러 디스크 관련 장애 메시지가 나타납니다.
- 대기 서버에서 장애가 발생하면 운영상에는 문제가 없지만 페일오버할 대상이 없으므로 서버 운영자는 반드시 MCCS UI를 통하여 웹 콘솔을 통하여 장애를 확인하고 대기 서버를 정상화 시켜야 합니다.
- 대기 서버가 다시 정상으로 돌아되면 'Pause' 에서 'Normal' 상태로 복구되면서 아이콘이 사라집니다.
...
- 서비스 네트워크 장애는 장애가 발생한 부분을 MCCS UI 창에서 웹 콘솔에서 확인할 수 있습니다.
- MCCS는 네트워크 장애가 발생된 서버의 네트워크 케이블 단절 또는 특정 네트워크로의 Ping 타임아웃 발생 유무를 확인합니다.
- 네트워크 주소 리소스가 장애 원인이라면 사용자는 네트워크 스위치 또는 네트워크 카드부터 점검해야 합니다. 네트워크와 관련된 물리적인 부분들이 정상화 된 후에는 MCCS 콘솔에서 '장애표시제거' 메뉴를 선택하여 장애 표시 항목을 제거합니다. 이 때부터는 페일오버가 가능한 상태가 됩니다.
- 자동으로 장애 표시를 제거하려면 그룹 속성의 AutoFaultClearTime에 0보다 큰 값을 설정하면 됩니다.
...
미러 디스크 리소스의 Split Brain
매우 드문 경우이지만 두 서버상에서 미러 디스크 역할이 모두 소스로 인식되는 경우입니다.
이러한 상황은 타깃이 소스로 변경되는 시점에 기존 소스가 타깃으로 변경되지 못한 결과이며, 이 때는 서로 자신의 데이터를 동기화하려 하지만 데이터를 받는 상대 서버 역시 자신이 소스 서버인 상태이므로 역할 변경을 거부하게 됩니다.
미러 디스크에서 Split Brain이 발생하는 상황은 다음과 같습니다.
- 소스 서버(A) 장애로 인해 페일오버가 발생합니다.
- MCCS에서 SWITCHOVERVOLUME 명령을 실행합니다.
- 기존 소스 볼륨이 삭제되지 않고 타깃 서버(B)의 역할이 소스로 변경됩니다. (미러 디스크 역할 변경)
- 최초의 소스 서버(A)를 재부팅합니다.
- 최초의 소스 서버(A)가 부팅된 후에 타깃 서버(B)의 역할을 확인합니다.
- 타깃 서버(B)가 소스이면 최초의 소스 서버(A)는 이미 정상적으로 페일오버 되었다고 판단하고 자신을 타깃으로 변경합니다.
- 미러 네트워크 이상 또는 다른 오류로 인하여 부팅 시점에 이 역할을 확인할 수 없게 됩니다. (5, 6번 과정 확인 실패)
- 양 서버의 미러 역할이 모두 소스가 됩니다. (Split Brain 발생)
이러한 상태가 되면 MCCS 콘솔상에서 미러 디스크 리소스의 아이콘 표시가 겹쳐서 나타나며, MirrorRole 속성값이 두 서버에 대해 모두 'Source'로 표시됩니다.
이러한 경우에는 미러 디스크 역할을 수동으로 변경해야 하며, 변경한 후에는 재동기화 과정이 발생합니다.
미러 디스크 역할을 수동으로 변경하는 방법은 MCCS 콘솔을 이용하면 됩니다.
...