...
- 네트워크 스위치 장애는 MCCS 로그, OS 시스템 로그에서 장애 내역을 확인할 수 있습니다.
서버 관리자는 케이블 연결 상태 및 ping 테스트를 통해 해당 네트워크 스위치 상태 및 네트워크 연결 상태를 확인하고 장애 원인을 제거해야 합니다. - 자동으로 장애 표시를 제거하려면 그룹 속성의 AutoFaultClearTime에 0보다 큰 값을 설정하면 됩니다.
- 네트워크 스위치 장애에 대한 복구는 해당 제조사를 통하여 지원 받으시기 바랍니다.
디스크 장애
미러 디스크
...
장애
소스 디스크 장애
운영 서버의 미러 디스크 리소스에 장애가 발생하면 MCCS 웹 콘솔에 장애가 표시됩니다. MCCS는 해당 디스크에 Read/Write가 불가능한 상황이므로 장애로 인식하여 대기 서버로 페일오버를 진행합니다.
[그림] 미러 디스크 장애 발생 화면
...
미러 디스크 리소스의 Split Brain
매우 드문 경우이지만 두 서버상에서 미러 디스크 역할이 모두 Primary로 인식되었고, GI 데이터 값이 불일치 하는 경우입니다.
이러한 상황은 타깃이 소스로 변경되는 시점에 기존 소스가 타깃으로 변경되지 못한 결과이며, 이 때는 서로 자신의 데이터를 동기화하려 하지만 이전 데이터값이 불일치 하기 때문에 자동으로 동기화하지 않게 됩니다. .
미러 디스크에서 Split Brain이 발생하는 상황은 다음과 같습니다.
- 소스 서버(A) 장애로 인해 페일오버가 발생합니다.
- 타깃 서버(B)의 역할이 Primary 로 변경됩니다. (미러 디스크 역할 변경)
- 최초의 소스 서버(A)를 재부팅합니다.
- 최초의 소스 서버(A)가 부팅된 후에 타깃 서버(B)의 역할을 확인합니다.
- 양 노드의 GI 값을 확인 합니다. .
- GI 데이터의 값이 일치유무를 확인하고 일치한다면 자동으로 데이터 동기화를 진행합니다. (5, 6번 과정 확인 실패)
- GI 데이터 값이 불일치 하여 어느한쪽 노드를 기준으로 동기화가 필요하며 동기화를 자동으로 진행하지 않습니다. (Split Brain 발생)
이러한 상태가 되면 MCCS MCCS 웹 콘솔에서 미러 디스크 리소스의 아이콘 표시와 겹쳐서 나타나며(), SplitBrainStatus 값이 True로 표시됩니다.
이러한 경우에는 미러 디스크 역할을 수동으로 변경해야 하며, 변경한 후에는 재동기화 과정이 발생합니다.
미러 디스크 역할을 수동으로 변경하는 방법은 MCCS 웹 콘솔을 이용하면 됩니다.
- MCCS 웹 콘솔을 사용해서 스플릿브레인을 해결하는 방법
리소스 속성창을 확인합니다.
[그림] 미러디스크 스플릿 브레인 확인미러관리 창을 확인합니다.
[그림] 미러디스크 스플릿 브레인 확인Warning 1)양노드의 ConnectState 는 StandAlone 이며, SplitBrainStatus 값은 True가 됩니다.
2) 미러디스크의 LastMirrorOnlineTime을 확인합니다. (LastMirrorOnlineTime은 시스템의 시간이므로 최신 데이터의 유무를 결정할 수 있는 절대값은 아닙니다)
3) 스플릿 브레인이 발생했을 때 발생하는 로그가 출력됩니다.
(DRBD 볼륨(r0)에 스플릿브레인이 발생했습니다.)
4) 미러관리 창에서 미러 상태가 'SPLIT' 상태 입니다.
- 미러디스크를 선택하고 오른쪽 버튼을 클릭하여 '스플릿 브레인 해결'을 클릭합니다.
[그림] 스플릿 브레인 해결 선택 - 스플릿브레인에 대한 설명창이 출력됩니다.
[그림] 소스 노드 선택에 대한 내용 확인 - 소스노드를 선택합니다.
[그림] 소스 롤 노드 선택 - 선택한 소스노드에 대해 다시 한번 확인합니다.
[그림] 소스 노드 선택 다시 확인 - 스플릿해결 중인 화면입니다.
[그림] 스플릿 브레인 해결 화면 - 스플릿해결 완료 화면입니다.
[그림] 스플릿 브레인 해결 완료 화면 선택한 노드가 소스노드가 되고 미러디스크의 DiskState 상태는 UpToData로 바뀌게 됩니다.
[그림] 스플릿 브레인 해결Warning 노드 B 의 변경된 정보는 모두 덮어써지게 됩니다
...