Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

 

Section

 

Column

MCCS를 사용하여 서버 이중화를 구성한 후, 서비스 운영 중에 여러 가지 장애가 발생할 수 있습니다.

이 장에서는 MCCS가 어떻게 장애를 감지하고 대처하는지에 대해 다음의 예제에서 상세하게 설명합니다.

(다음 예제에서 운영 서버는 'Active', 대기 서버는 'Standby'란 이름으로 MCCS에 등록되어 있습니다.)

 

Column
width350px

 

Panel

이 페이지의 주요 내용

Table of Contents
maxLevel4

 

 

...

  1. 네트워크 스위치 장애는 MCCS 로그, 윈도우 시스템 로그에서 장애 내역을 확인할 수 있습니다. 
    서버 관리자는 케이블 연결 상태 및 ping 테스트를 통해 해당 네트워크 스위치 상태 및 네트워크 연결 상태를 확인하고 장애 원인을 제거해야 합니다.
  2. 자동으로 장애 표시를 제거하려면 그룹 속성의 AutoFaultClearTime에 0보다 큰 값을 설정하면 됩니다.
  3. 네트워크 스위치 장애에 대한 복구는 해당 제조사를 통하여 지원 받으시기 바랍니다.

디스크 장애

미러 디스크

...

장애 (내장 스토리지

...

)
  • 소스 디스크 장애 운영 서버의 미러 디스크 리소스에 장애가 발생하면 MCCS GUI에 장애가 표시됩니다. MCCS는 해당 디스크에 Read/Write가 불가능한 상황이므로 장애로 인식하여 대기 서버로 페일오버를 진행합니다. 
     
    [그림] 미러 디스크 장애 발생 화면

...

  1. 리소스 속성창을 확인합니다.

    [그림] 미러디스크 스플릿 브레인 확인


  2. 미러관리 창을 확인합니다.


    [그림] 미러디스크 스플릿 브레인 확인

    Warning

    1)양노드의 MirrorRole은 Source, MirrorState은 MIRROR_PAUSED 상태가 됩니다.

    2) 미러디스크의 TimeAquiredSourceRole을 확인합니다. (TimeAquiredSourceRole은 시스템의 시간이므로 최신 데이터의 유무를 결정할 수 있는 절대값 아닙니다)

    3) 스플릿 브레인이 발생했을 때 발생하는 로그가 출력됩니다. 

    (윈도우즈 이벤트 오류: An invalid attempt to establish a mirror occurred. Both systems were found to be Source. Local Volume: F Remote system: 200.200.124.49 Remote Volume: F The mirror has been paused, or left in its current non-mirroring state. Use the DataKeeper DataKeeper 

    User Inteface to resolve this Split Brain condition.)

    4) 미러관리 창에서 미러 상태가 'SPLIT' 상태 입니다.

     

  3. 미러디스크를 선택하고 오른쪽 버튼을 클릭하여 '스플릿 브레인 해결'을 클릭합니다.

    [그림] 소스 롤 노드 선택스플릿 브레인 해결  선택

  4. 스플릿브레인에 대한 설명창이 출력됩니다.
     
    [그림] 소스 노드 선택에 대한 내용 확인

  5. 소스노드를 선택합니다.

    [그림] 소스 롤 노드 선택

  6. 선택한 소스노드에 대해 다시 한번 확인합니다.

    [그림] 소스 노드 선택 다시 확인

  7. 스플릿해결 중인 화면입니다.

    [그림] 스플릿 브레인 해결 화면

  8. 스플릿해결 완료 화면입니다.

    [그림] 스플릿 브레인 해결 완료 화면

  9. 선택한 노드가 소스노드가 되고 미러디스크의 상태는 MIRRORING 상태로 바뀌게 됩니다. 

    [그림] 스플릿 브레인 해결

    Warning

    노드 B 의 변경된 정보는 모두 덮어써지게 됩니다

     

 

공유 디스크

...

장애 (외장 스토리지

...

)

외장 디스크의 연결 경로 및 디스크에 장애가 발생하면 해당 디스크의 Read/Write가 불가능하므로 MCCS는 장애를 표시하고 페일오버를 진행합니다.

[그림]

...

공유

...

디스크

...

장애

...

발생

...

화면

  1. 외장 스토리지 장애는 MCCS 로그, 시스템 로그에서 장애 내역을 확인할 수 있습니다.
  2. 외장 스토리지 자체에 문제가 생기면 스토리지를 복구 할 때까지 서버 운영이 중단 됩니다. 따라서 빠른 시간 내에 스토리지를 복구하거나 임시 스토리지(백업 스토리지)로 교체해서 사용해야 합니다.

  3. 외장 스토리지와 관련된 장애는 해당 스토리지 업체에 문의하시기 바랍니다.

  4. 장애가 발생한 서버의 외장 스토리지 연결 및 디스크가 정상화 되면 MCCS 커널 드라이버가 복구된 환경을 다시 인식할 수 있도록 MCCS의 서버를 재부팅 해야 합니다.

  5. 또한 해당 스토리지 벤더를 통해 스토리지의 이중화 대책을 마련해야 합니다.

NetBIOS

...

장애

Direct-Hosted SMB 사용

Windows 2000 이상에서 지원하는 SMB는 Direct-Hosted 방식을 지원합니다. 이 기능은 NetBIOS 인터페이스를 사용하지 않고 직접 파일공유 서비스를 지원합니다.

...

즉, NetBIOS 에이전트를 사용하면서 DNS 서버와 연동할 경우에는 클라이언트가 파일서버에 대부분 Direct-Hosted SMB 방식으로 연결됩니다.

관련 캐시 플러시

에이전트 동작 확인시확인 시, 관련 캐시를 플러시합니다. 

NetBIOS table 캐시 플러시 방법

...

Code Block
arp -d
방화벽 설정해제

NetBIOS 통신관련 해제대상 해제 대상 포트번호는 다음과 같습니다.

Panel

TCP/UDP 137,138,139, 445

...

Panel

TCP/UDP 42, 53

워크스테이션(Workstation) 서비스 중단시 중단 시 고려사항

Windows 서비스에서 Workstation 서비스는 SMB 프로토콜을 사용하여 원격 서버에 대한 클라이언트 네트워크 연결을 만들고 유지합니다.

...

서비스 이름
Alerter Service
Browser Service
Messenger Service
Net Logon Service
RPC Locator Service
서버(Server) 서비스 중단시 중단 시 고려사항

Windows 서비스에서 Server 서비스는 이 컴퓨터에 대해 파일, 인쇄 및 명명된 파이프를 네트워크를 통해 공유할 수 있도록 지원합니다.

...

Server 서비스를 중지 할때는 주의해야 합니다.

서비스 이름
Browser Service
파일공유 가 파일공유가 안 될 경우

가상이름이 아닌 노드의 원래 NetBIOS 컴퓨터 이름으로 파일공유가 되는지 먼저 확인합니다.

...

페일오버된 상황에서 클라이언트가 갖고 있는 가상이름의 IP주소가 페일오버 전 노드의 주소를 갖는 경우가 발생하면 클라이언트의 NetBIOS 케시가 플러시 될때까지 수 분 동안 통신이 안될 수 도 있습니다. WINS 서버를 사용하는 경우 이런 상황이 발생 가능합니다 . 따라서 이런 경우 클라이언트 프로그램은 이중화 동작이 발생하는 환경 임을 인지 할 수 있어야 합니다.

 

SCSI-Lock

...

장애

SCSI3-PR 을 사용하는 볼륨매니저와 연동할 때

...