...
리소스 속성창을 확인합니다.
[그림] 미러디스크 스플릿 브레인 확인미러관리 창을 확인합니다.
[그림] 미러디스크 스플릿 브레인 확인Warning 1)양노드의 MirrorRole은 Source, MirrorState은 MIRROR_PAUSED 상태가 됩니다.
2) 미러디스크의 TimeAquiredSourceRole을 확인합니다. (TimeAquiredSourceRole은 시스템의 시간이므로 최신 데이터의 유무를 결정할 수 있는 절대값은 아닙니다)
3) 스플릿 브레인이 발생했을 때 발생하는 로그가 출력됩니다.
(윈도우즈 이벤트 오류: An invalid attempt to establish a mirror occurred. Both systems were found to be Source.
Local Volume: F Remote system: 200.200.124.49 Remote Volume: F The mirror has been paused, or left in its current non-mirroring state.
Use the DataKeeper User Inteface to resolve this Split Brain condition.)
4) 미러관리 창에서 미러 상태가 'SPLIT' 상태 입니다.
- 미러디스크를 선택하고 오른쪽 버튼을 클릭하여 '스플릿 브레인 해결'을 클릭합니다.
[그림] 스플릿 브레인 해결 선택 - 스플릿브레인에 대한 설명창이 출력됩니다.
[그림] 소스 노드 선택에 대한 내용 확인 - 소스노드를 선택합니다.
[그림] 소스 롤 노드 선택 - 선택한 소스노드에 대해 다시 한번 확인합니다.
[그림] 소스 노드 선택 다시 확인 - 스플릿해결 중인 화면입니다.
[그림] 스플릿 브레인 해결 화면 - 스플릿해결 완료 화면입니다.
[그림] 스플릿 브레인 해결 완료 화면 선택한 노드가 소스노드가 되고 미러디스크의 상태는 MIRRORING 상태로 바뀌게 됩니다.
[그림] 스플릿 브레인 해결Warning 노드 B 의 변경된 정보는 모두 덮어써지게 됩니다
...
외장 스토리지
...
장애
외장 디스크의 연결 경로 및 디스크에 장애가 발생하면 해당 디스크의 Read/Write가 불가능하므로 MCCS는 장애를 표시하고 페일오버를 진행합니다.
[그림] 공유 디스크 장애 발생 화면
외장 스토리지 장애는 MCCS 로그, 시스템 로그에서 장애 내역을 확인할 수 있습니다.
외장 스토리지 자체에 문제가 생기면 스토리지를 복구 할 때까지 서버 운영이 중단 됩니다. 따라서 빠른 시간 내에 스토리지를 복구하거나 임시 스토리지(백업 스토리지)로 교체해서 사용해야 합니다.
외장 스토리지와 관련된 장애는 해당 스토리지 업체에 문의하시기 바랍니다.
장애가 발생한 서버의 외장 스토리지 연결 및 디스크가 정상화 되면 MCCS 커널 드라이버가 복구된 환경을 다시 인식할 수 있도록 MCCS의 서버를 재부팅
해야 합니다.또한 해당 스토리지 벤더를 통해 스토리지의 이중화 대책을 마련해야 합니다.
NetBIOS 장애
Direct-Hosted SMB 사용
Windows 2000 이상에서 지원하는 SMB는 Direct-Hosted 방식을 지원합니다. 이 기능은 NetBIOS 인터페이스를 사용하지 않고 직접 파일공유 서비스를 지원합니다.
이름의 IP주소 해결을 위해 DNS 를 통한 조회가 발생하고 NetBIOS 이름해결 절차는 사용되지 않습니다.
송수신 동작
- 기본적으로 리디렉터(워크스테이션 서비스)는 NetBIOS 장치와 SMB 장치 모두에 대해 호출하며, 파일 서버는 NetBIOS 장치와 SMB 장치 모두에 대한 호출을 수신합니다.
- 파일 서버의 SMB 장치는 기존 TCP를 통한 NetBIOS 포트 139가 아닌 TCP 포트 445에서 호출을 받으려 우선 대기(리슨)합니다.
- SMB 세션이 445 포트로 실패할 경우 139(NetBT) 포트를 사용합니다. 만일 둘다 실패하면 연결이 실패됩니다.
즉, NetBIOS 에이전트를 사용하면서 DNS 서버와 연동할 경우에는 클라이언트가 파일서버에 대부분 Direct-Hosted SMB 방식으로 연결됩니다.
관련 캐시 플러시
에이전트 동작 확인 시, 관련 캐시를 플러시합니다.
NetBIOS table 캐시 플러시 방법
Code Block |
---|
netbtstat -R |
DNS 캐시 플러시 방법
Code Block |
---|
ipconfig /flushdns |
ARP 캐시 플러시 방법
Code Block |
---|
arp -d |
방화벽 설정해제
NetBIOS 통신관련 해제 대상 포트번호는 다음과 같습니다.
Panel |
---|
TCP/UDP 137,138,139, 445 |
DNS 서버 업데이트, WINS 서버 업데이트에 관련된 포트번호는 다음과 같습니다.
Panel |
---|
TCP/UDP 42, 53 |
워크스테이션(Workstation) 서비스 중단 시 고려사항
Windows 서비스에서 Workstation 서비스는 SMB 프로토콜을 사용하여 원격 서버에 대한 클라이언트 네트워크 연결을 만들고 유지합니다.
이 서비스가 중지되면 해당 연결을 사용할 수 없습니다. 이 서비스를 사용하지 않으면 이 연결을 명시적으로 사용하는 다음 서비스를 시작할 수 없습니다.
워크스테이션 서비스를 중지 할때는 주의해야 합니다.
서비스 이름 |
---|
Alerter Service |
Browser Service |
Messenger Service |
Net Logon Service |
RPC Locator Service |
서버(Server) 서비스 중단 시 고려사항
Windows 서비스에서 Server 서비스는 이 컴퓨터에 대해 파일, 인쇄 및 명명된 파이프를 네트워크를 통해 공유할 수 있도록 지원합니다.
이 서비스가 중지되면 이런 기능을 사용할 수 없게 됩니다. 이 서비스가 사용할 수 없게 설정되면 이 서비스에 종속성이 있는 다음 서비스는 시작할 수 없게 됩니다.
Warning |
---|
Cluster 가 구성된 서버에서는 NetBIOS 에이전트를 이용하기 위해, Server 서비스의 상태가 반드시 "시작됨"으로 되어 있어야 합니다. |
Server 서비스를 중지 할때는 주의해야 합니다.
서비스 이름 |
---|
Browser Service |
파일공유가 안 될 경우
가상이름이 아닌 노드의 원래 NetBIOS 컴퓨터 이름으로 파일공유가 되는지 먼저 확인합니다.
클라이언트에서 dir, start, explorer 또는 net view 명령으로 노드 파일에 정상적으로 접근이 가능한지 확인합니다.
DIR 명령으로 확인합니다.
DIR 명령은 다음의 명령어로 실행합니다.
Code Block |
---|
dir \\virtual_name\shared_folder |
START 명령으로 확인합니다.
START 명령은 다음의 명령어로 실행합니다.
Code Block |
---|
start \\virtual_name |
EXPLORER 명령으로 확인합니다.
EXPLORER 명령은 다음의 명령어로 실행합니다.
Code Block |
---|
explorer \\virtual_name |
NET VIEW 명령으로 확인합니다.
NET VIEW 명령은 다음의 명령어로 실행합니다.
Code Block |
---|
net view virtual_name |
컴퓨터의 파일과 인쇄 공유 목록이 생성됩니다. 지정된 컴퓨터에서 사용할 수 있는 파일이나 인쇄 공유가 없으면 "목록에 항목이 없습니다." 메시지가 나타납니다.
페일오버된 상황에서 클라이언트가 갖고 있는 가상이름의 IP주소가 페일오버 전 노드의 주소를 갖는 경우가 발생하면 클라이언트의 NetBIOS 케시가 플러시 될때까지 수 분 동안 통신이 안될 수 도 있습니다. WINS 서버를 사용하는 경우 이런 상황이 발생 가능합니다 . 따라서 이런 경우 클라이언트 프로그램은 이중화 동작이 발생하는 환경 임을 인지 할 수 있어야 합니다.
SCSI Lock 장애
SCSI3-PR 을 사용하는 볼륨매니저와 연동할 때
볼륨 매니져(예: 시멘택의 SFW 같이 SCSI3-PR 예약 기능을 사용하는 제품)는 SCSI Lock 에이전트와 같이 사용할 수 없습니다.
SCSI3-PR을 지원하는지 확인할 때
디스크가 SCSI3-PR 기능을 지원하는지 scsicmd.cmd 명령으로 PR 타입을 확인합니다.
sg_scan.exe 또는 sg_persist.exe 패스를 못 찾을 때
해당명령이 %MCCS_HOME%/bin 에 존재하는지 확인합니다.
공유 디스크 에이전트와 연동할 때
공유디스크 에이전트와 SCSI Lock 에이전트를 연동할 경우, 공유디스크 에이전트 동작이 정상임을 확인 한 후에 SCSI Lock 에이전트를 등록합니다.
이때 SCSI Lock 에이전트의 디스크 사용목적은 H/W적인 LOCK 장치로 사용하기 위함이지 디스크의 내용을 사용하지는 않습니다. 따라서 디스크의 크기는 작아도 되며 내용은 보호하지 않습니다.
등록 키 충돌 오류가 날 때
scsicmd.cmd -c 옵션 혹은 scsicmd.cmd -cf 옵션 으로 예약키 또는 등록키를 모두 제거한 후 다시 설정해야합니다. 그리고 리소스 등록전에는 등록된 키는 없는지 확인하고 있으면 제거후 등록해야 합니다.
참고로 현재 키는 노드의 MAC 주소를 사용하여 자동으로 설정합니다. 여러개의 네트웍 어탭터중에서 첫 번째 어탭터의 MAC 주소를 사용합니다. 이 키는 설정파일에 자동 기록합니다. 설정파일에 키가 존재할 경우에는 키를 새로 만들지 않습니다.
하나의 디스크에 여러 레터가 존재할 경우 한개의 레터에 예약 시 나머지에 레터에 접근을 못할 때
SCS Lock 대상 디스크는 기본 디스크와 단일 레터를 지원합니다. 동적 디스크나 다중 볼륨(하나의 LUN에 여러 파티션을 구성하는 경우)을 사용하는 디스크는 사용하지 마십시요.
에이전트 등록 후 DUID가 해결되지 못한 상태로 유지될 때
레터를 정의하고 활성화를 요청해야 main.json에 해당 레터에 연결된 DUID 정보가 기록됩니다.
에이전트 삭제할 때
SCSI Lock 에이전트가 삭제될때 예약을 해제합니다. 따라서 예약대상 공유디스크가 상대 노드에서 사용될 가능성을 염두에 두고 삭제를 해야 합니다. 즉 삭제할 경우에는 상대 노드를 다운시킨 후 작업하십시요.
공유 디스크 환경 구성의 예
외장 스토리지 장애
외장 디스크의 연결 경로 및 디스크에 장애가 발생하면 해당 디스크의 Read/Write가 불가능하므로 MCCS는 장애를 표시하고 페일오버를 진행합니다.
[그림] 공유 디스크 장애 발생 화면
외장 스토리지 장애는 MCCS 로그, 시스템 로그에서 장애 내역을 확인할 수 있습니다.
외장 스토리지 자체에 문제가 생기면 스토리지를 복구 할 때까지 서버 운영이 중단 됩니다. 따라서 빠른 시간 내에 스토리지를 복구하거나 임시 스토리지(백업 스토리지)로 교체해서 사용해야 합니다.
외장 스토리지와 관련된 장애는 해당 스토리지 업체에 문의하시기 바랍니다.
장애가 발생한 서버의 외장 스토리지 연결 및 디스크가 정상화 되면 MCCS 커널 드라이버가 복구된 환경을 다시 인식할 수 있도록 MCCS의 서버를 재부팅 해야 합니다.
또한 해당 스토리지 벤더를 통해 스토리지의 이중화 대책을 마련해야 합니다.
스탠드얼론 모드(Standalone Mode)로의 전환
MCCS는 서버를 이중화하여 중단 없는 서비스를 고객에게 제공하는 것이 목적입니다.
그렇지만 서비스 운영 중에 일부 노드가 물리적인 장애 또는 운영 체제 상의 장애로 인하여 노드간의 핫빗 통신이 불가능한 상황이 발생할 수 있습니다.
MCCS 에이전트는 짝(Pair)으로 움직입니다. 만일 쌍(Pair)으로 움직이지 못하는 경우가 발생하면 MCCS는 콘솔 접속 등 모든 동작이 정상적으로 이루어지지 않게 되어 단독으로 실행될 수 밖에 없습니다.
이런 상황에서는 한 대의 서버로만 MCCS 서비스를 운영해야 하므로 스탠드얼론 모드로의 전환이 필요하게 됩니다.
스탠드얼론 모드로의 전환 절차
...
스탠드얼론 모드의 해제 절차
문제가 있었던 서버가 정상 상태로 돌아오면 서버 관리자는 스탠드얼론 모드를 해제하고, 다음과 같이 서버 이중화 작업을 다시 진행해야 합니다.
MCCS 에이전트를 중지하거나 재시작 해도 운영중인 서비스에는 어떠한 영향도 없습니다.
스탠드얼론 모드의 해제 절차는 다음과 같습니다.
...
...
해야 합니다.
또한 해당 스토리지 벤더를 통해 스토리지의 이중화 대책을 마련해야 합니다.
SCSI Lock 장애
SCSI3-PR 을 사용하는 볼륨매니저와 연동할 때
볼륨 매니져(예: 시멘택의 SFW 같이 SCSI3-PR 예약 기능을 사용하는 제품)는 SCSI Lock 에이전트와 같이 사용할 수 없습니다.
SCSI3-PR을 지원하는지 확인할 때
디스크가 SCSI3-PR 기능을 지원하는지 scsicmd명령으로 scsicmd.cmd 명령으로 PR 타입을 확인합니다.
sg_scan.exe 또는 sg_
...
persist.exe 패스를 못 찾을 때
SG3_UTIL 패키지가 OS에 설치돼었는지 해당명령이 %MCCS_HOME%/bin 에 존재하는지 확인합니다.
공유 디스크 에이전트와 연동할 때
공유디스크 에이전트와 SCSI Lock 에이전트를 연동할 경우, 공유디스크 에이전트 동작이 정상임을 확인 한 후에 SCSI Lock 에이전트를 등록합니다.
이때 SCSI Lock 에이전트의 디스크 사용목적은 H/W적인 LOCK 장치로 사용하기 위함이지 디스크의 내용을 사용하지는 않습니다. 따라서 디스크의 크기는 작아도 되며 내용은 보호하지 않습니다.
등록 키 충돌 오류가 날 때
scsicmd.cmd -c 옵션 혹은 scsicmd.cmd -cf 옵션 으로 예약키 또는 등록키를 모두 제거한 후 다시 설정해야합니다. 그리고 리소스 등록전에는 등록된 키는 없는지 확인하고 있으면 제거후 등록해야 합니다.
참고로 현재 키는 노드의 MAC 주소를 사용하여 자동으로 설정합니다. 여러개의 네트웍 어탭터중에서 첫 번째 어탭터의 MAC 주소를 사용합니다. 이 키는 설정파일에 자동 기록합니다. 설정파일에 키가 존재할 경우에는 키를 새로 만들지 않습니다.
하나의 디스크에 여러 레터가 존재할 경우 한개의 레터에 예약 시 나머지에 레터에 접근을 못할 때
SCS Lock 대상 디스크는 기본 디스크와 단일 레터를 지원합니다. 동적 디스크나 다중 볼륨(하나의 LUN에 여러 파티션을 구성하는 경우)을 사용하는 디스크는 사용하지 마십시요.
에이전트 등록 후 DUID가 해결되지 못한 상태로 유지될 때
레터를 정의하고 활성화를 요청해야 main.json에 해당 레터에 연결된 DUID 정보가 기록됩니다.
에이전트 삭제할 때
SCSI Lock 에이전트가 삭제될때 예약을 해제합니다. 따라서 예약대상 공유디스크가 상대 노드에서 사용될 가능성을 염두에 두고 삭제를 해야 합니다. 즉 삭제할 경우에는 상대 노드를 다운시킨 후 작업하십시오작업하십시요.
서포트 파일을 수집하는 방법
MCCS 에 문제가 생겼을 경우 로그와 환경 정보의 수집을 위해서 서포트 파일을 수집할 수 있습니다.
...