먼저 bsr 의 구성에 따르는 필요한 구성요소들을 살펴보고 구성형태를 예시와 함께 설명합니다.
구성 요소
복제를 구축하기 위해서는 노드(호스트)와 복제 대상 볼륨, 그리고 복제 노드간의 통신 채널을 위한 네트워크가 구성되어야 합니다. 그리고 이러한 구성요소들을 하나의 리소스 단위로 구성파일에 기술하여 복제 클러스터를 정의합니다.
노드
기본적으로 운영노드와 대기노드를 준비해야 하며 대기노드는 N 개의 노드로 운영할 수 있습니다. 복제를 위해 최소한 둘 이상의 노드가 요구됩니다.
노드는 호스트와 구분되는 용어 이지만 여기서는 엄격하게 구분하지는 않으며 구분이 필요한 경우에만 호스트로 기술하고 그 이외에는 노드로 기술합니다.
볼륨
데이터 볼륨
클러스터 노드 모두에서 동일한 크기의 저장 장치를 준비해야 합니다. 크기가 다른 볼륨으로 구성할 경우, 최소한 타겟 노드의 볼륨의 크기가 소스노드의 볼륨 크기보다 커야하지만 다른 크기로 볼륨을 구성하는 것은 권장하지 않습니다. (파티셔닝 해서 양측 크기를 완전히 일치 시키세요)
bsr 에서 복제 볼륨의 크기는 파티션 크기(바이트 단위) 입니다. 소스와 타깃 양측이 1바이트라도 크기가 다르면 복제 연결 시 오류가 발생합니다.
파티션 크기 구하기
윈도우즈 powershell 에서
gwmi -Query "SELECT * from Win32_DiskPartition"
리눅스 명령프롬프트 에서
fdisk -l
볼륨은 운영체제에 따라 적당한 파일시스템으로 포맷되어야 하며 윈도우즈와 리눅스에서 제공하는 NTFS/ReFS, ext/xfs 등의 파일시스템을 사용합니다. 볼륨은 파티셔닝 방식에 따라 MBR, GPT, 확장파티션의 논리적드라이브 또는 장치가 될 수 있으며 스팬, 스트라이프, 미러 등 RAID 형식의 동적디스크를 모두 포함하여 구성할 수 있습니다. 만일 볼륨이 이미 포맷된 상태이고 중요 데이터를 포함하고 있다면 기존 볼륨을 그대로 사용하여 구성하면 됩니다.
복제를 위한 볼륨에 가상메모리 운영을 위한 페이징 파일 설정이 있어서는 안됩니다. 페이징 파일 설정이 있을 경우 볼륨에 대한 umount 를 수행할 수 없습니다.
bsr에서 지원하는 복제 볼륨의 최대 크기는 이론적으로 1PB 이며 통상 10TB 이상의 볼륨을 대용량 볼륨으로 간주합니다.
씬 프로비저닝 환경의 공간회수 기능이 bsr 과 호환되지 않습니다. 씬 프로비저닝 스토리지 환경에서 구축하려면 공간회수 기능을 비활성화하고 사용해야 합니다.
메타 볼륨
bsr은 복제를 운영하기 위해 필요한 부가 정보들을 별도의 비휘발성 저장공간에 보관하고 이 데이터를 실시간 쓰고 읽는 작업을 복제 중에 동시에 수행합니다. 이러한 부가정보를 메타 데이터라고 하고 이를 기록하는 저장장치 볼륨을 메타 볼륨이라고 합니다. 메타 볼륨은 복제 볼륨에 1:1 대응하도록 준비해야 하며, 크기는 1 node 복제를 기준으로 1TB 당 약 33MB의 공간을 요구합니다. 예를 들어 1:2 복제, 3TB 복제 볼륨의 경우 2 * 3 * 33MB = 198MB 크기의 메타 볼륨이 필요합니다.
메타 데이터는 위치하는 경로에 따라 복제볼륨과 같은 디스크 장치에 있을 경우 내부메타(Internal Meta)라고 하며, 복제볼륨이 아닌 다른 외부 디스크에 메타데이터가 위치할 경우 외부메타(External Meta)라고 합니다. 내부메타는 별도의 디스크 장치를 준비할 필요가 없는 장점이 있지만 성능 상으로는 서로 다른 디스크로 I/O를 수행하는 외부메타 방식이 조금이라도 더 유리합니다. 내부메타는 다음의 예와 같이 구성 파일에서 internal 키워드로 기술하면 bsr이 초기화 시점에 복제 볼륨을 파티셔닝하고 구분된 메타 영역 내에서 메타데이터를 자동으로 생성하는 방식입니다. internal 키워드는 Linux 환경에서만 제공합니다.
Linux Internal Meta
resource r0 {
...
meta-disk internal;
...
}
외부 메타 디스크는 메타디스크로 사용할 장치를 구성파일에 몇 가지 방식으로 지정할 수 있으며 운영체제에 따라 Windows 에선 마운트 포인트로, Linux 에서는 디스크 장치의 장치명으로 지정합니다. 그리고 bsr에선 가상디스크 장치에 대한 메타볼륨을 지원하여 별도의 물리적인 디스크 장치가 없더라도 가상의 볼륨을 메타 볼륨으로 사용할 수 있습니다. 가상볼륨장치는 Windows 에선 VHD, Linux 에선 Loop 장치로 별도 준비해야 합니다.
다음은 외부 메타디스크에 대한 지정의 예 입니다.
External Meta - Windows Letter Mount Point
resource r0 {
...
meta-disk m;
...
}
External Meta - Windows GUID Mount Point
resource r0 {
...
meta-disk "\\?\Volume{d41d41d8-17fb-11e6-bb93-000c29ac57ee}\";
...
}
External Meta - Windows GUID Mount Point + VHD
resource r0 {
...
meta-disk "\\?\Volume{ed8a8f02-18b3-11e6-91b4-000c29ac57f8}\" "c:\r0_meta.vhd";
...
}
가상디스크는 파일디스크의 일종으로 한번 구성하여 마운트 시켰다 하더라도 시스템이 재 시작 될 경우 자동으로 재마운트 하지 않습니다. 따라서 bsr은 구성파일에 기술한 가상디스크 파일의 절대경로를 통해 시스템 재 시작 시 자동으로 마운트하도록 조치합니다. 이 과정은 bsr 서비스와 스크립트를 통해 자동 처리합니다.
External Meta - Linux device name
resource r0 {
...
meta-disk /dev/sdc1;
...
}
External Meta - Linux loop device
resource r0 {
...
meta-disk /dev/loop0 /bsr_meta/r0_meta;
...
}
메타 디스크 볼륨은 일반적인 파일시스템으로 포맷하지 않고 RAW 파일시스템 상태로 준비해야 합니다.
연결
bsr은 복제셋 구성 시 전용선의 사용을 권장하지만 절대적인 것은 아닙니다. 전용선이나 back-to-back 연결, Gigabit 이더넷 연결이 가장 합리적인 선택이지만, 스위치 장비를 넘어서 복제를 할 경우엔 라우터를 통한 처리율과 지연률등의 성능 문제를 감안해야 합니다.
bsr의 리소스는 통상 7788 이상의 TCP 수신대기 포트를 사용하며 각각의 리소스는 포트를 다르게 설정해야 하고 로컬 방화벽에서 해당 리소스에서 설정한 포트를 허용해야 합니다. 물론 다른 응용 프로그램에서 bsr의 TCP 포트를 사용하지 못하도록 해야 합니다.
보통 아래와 같은 순서로 연결을 구성하게 될 것입니다.
호스트들(bsr-active, bsr-standby)은 전용 네트워크 인터페이스 eth1을 사용하고 IP주소를 10.1.1.31 및 10.1.1.32으로 할당 합니다.
bsr에서 TCP포트 7788 부터 7799를 사용합니다.
로컬 방화벽에서 호스트들 간에 인바운드 및 아웃바운드 포트 모두 허용 설정 합니다.
리소스 작성
리소스 작성은 위에서 언급한 구성요소들을 구성파일로 만드는 것 입니다. 즉, 노드(호스트) 정보와 볼륨, 연결 정보를 정해진 구역(섹션)내에서 속성에 맞는 키워드들을 통해 기술하면 됩니다.
bsr의 모든 구성 파일은 설치경로의 하위 etc 디렉터리에 위치하고 bsr 유틸리티들은 해당 경로에서 구성파일을 로드합니다.
먼저 etc 디렉터리에서 bsr.conf를 생성합니다. bsr.conf 파일의 일반적인 내용은 아래와 같습니다.
include "bsr.d/global_common.conf";
include "bsr.d/*.res";
우선 관례적으로 bsr의 전역(global), 공통(common) 섹션을 /etc/bsr.d/global_common.conf 파일에서 작성합니다. 그리고 모든 .res 파일들을 포함(include)하도록 하여 리소스 별로 파일을 분리해서 관리할 수 있도록 하는 체계를 권장합니다.
몇 가지 약속된 구역을 기준으로 속성을 기술하는데 이 구역을 섹션이라고 합니다. 섹션은 최상위 구역으로 Global, Common, Resource 섹션이 있으며, 각 섹션내에서 속셩 별 하위 섹션들이 있습니다. 여기서는 주요한 섹션과 일부 기본적인 속성에 대해서만 설명합니다. 구성파일과 관련한 자세한 내용은 부록의
Global 섹션
이 섹션은 전역적으로 한번 만 사용 할 수 있으며, 일반적으로 /etc/bsr.d/global_common.conf 파일 안에 있습니다. 단일 파일로 구성한다면 구성 파일의 맨 상단에 작성하면 됩니다.
이 섹션에 포함되는 구성은 명령어 타임아웃, ip 유효성 검사 등 사용자 인터페이스와 관련 있는 옵션들입니다.
Common 섹션
이 섹션에서는 모든 리소스에 공통적인 속성으로 설정할 수 있는 설정값을 제공하며 보통 /etc/bsr.d/global_common.conf 에서 작성합니다. 물론 리소스 개별적으로 각각의 속성 옵션을 정의 할 수도 있습니다.
<Common> 섹션이 반드시 있어야 되는건 아니지만, 둘 이상의 리소스를 사용하는 경우에는 꼭 사용할 것을 권장합니다. 그렇지 않으면, 재사용되는 옵션들에 의해 복잡해질 수 있습니다. 예를들어, <Common> 섹션에서 <net> {protocol C;}를 설정할 경우 모든 리소스는 별도의 옵션이 지정되지 않는 한 이 옵션을 상속합니다.
Resource 섹션
한 개의 리소스 구성 파일명은 보통 /etc/bsr.d/<resource>.res 형태로 생성합니다. 여기서 사용된 리소스 이름은 리소스파일 내에서 명시해야 합니다. 이름을 정하는 것은 임의로 식별 가능하게 명명하지만 US-ASCII 형식이어야 하며 공백문자를 포함해선 안됩니다. 또한 모든 리소스 구성에는 <host> 하위 섹션이 두 개 이상 있어야 합니다. 다른 모든 구성 설정은 Common 섹션으로부터 상속되거나 bsr의 기본값으로 설정됩니다. 양쪽 호스트에 공통적인 값을 가진 옵션은 <host>의 상위 <resource> 섹션 부분에서 한 번에 바로 지정해도 되는데 다음 예제처럼 기술하여 간소화 시킬 수 있습니다.
각 노드의 노드 id(node-id) 의 지정은 필수사항 입니다.
resource r0 { disk d; meta-disk f; on alice { address 10.1.1.31:7789; node-id 0; } on bob { address 10.1.1.32:7789; node-id 1; } } |
구성 방식
bsr 은 다양한 구성 방식을 통해 기업의 중요 데이터를 유연한 방식으로 이중화할 수 있습니다. 미러 구성은 통상 로컬 네트워크 내에서 복제하는 구성을 말하고, 원격지 네트워크 간의 복제 구성을 재해복구(DR) 구성이라고 합니다.
로컬 미러
로컬 네트워크 내에서의 이중화를 위한 일반적인 미러링 구성 방식으로 복제 프로토콜은 일반적으로 동기방식으로 구성합니다.
/etc/bsr.d/r0.res
resource r0 { net { protocol C; } on alice { disk d; address 10.1.1.31:7789; meta-disk f; node-id 0; } on bob { disk d; address 10.1.1.32:7789; meta-disk f; node-id 1; } } |
로컬 1:N 미러
로컬 네트워크 내의 N 노드 복제 구성으로 1:1 미러를 N 노드로 확장한 구성입니다. 복제 프로토콜은 일반적으로 동기방식으로 구성하지만 N 노드 복제로 인해 성능저하가 발생할 경우 비동기 방식 구성도 고려할 수 있습니다. 복제 프로토콜은 구성에서 생략할 경우 기본값이 동기(C) 방식입니다.
resource r0 { //net { // protocol C; //} device e minor 2; disk e; meta-disk f; on store1 { address 10.1.10.1:7100; node-id 0; } on store2 { address 10.1.10.2:7100; node-id 1; } on store3 { address 10.1.10.3:7100; node-id 2; } connection-mesh { hosts store1 store2 store3; } }
원격 재해복구(DR)
WAN 구간을 통한 재해복구 복제 구성으로 비동기 프로토콜을 기본으로 사용하고 버퍼링을 위한 송신버퍼 설정과 버퍼가 혼잡해졌을 경우의 상황을 대비하기 위한 모드를 설정해야 합니다. 혼잡모드와 관련한 더 자세한 사항은 혼잡 모드 부분을 참고하세요.
resource r0 { net { protocol A; sndbuf-size 1G; on-congestion pull-ahead; congestion-fill 900M; } on main_server { disk d; address 10.1.1.31:7789; meta-disk f; node-id 0; } on dr_server { disk d; address 10.1.1.32:7789; meta-disk f; node-id 1; } }
또한 복제 가속기(DRX)를 연동 할 경우 복제 처리 성능을 극대화할 수 있습니다.
로컬 미러 & 원격 재해복구(MDR)
로컬 네트워크의 미러링 구성과 WAN 구간 원격 재해복구 복제의 혼합 구성입니다. 로컬 미러는 동기방식으로 WAN 원격 복제는 비동기 방식으로 혼합하여 구성합니다. WAN 구간 복제는 송신버퍼와 혼잡모드를 설정해야 하고 복제 가속기(DRX)의 연동을 권장합니다.
resource r0 { volume 0 { device e minor 2; disk e; meta-disk f; } on store1 { node-id 1; // Active } on store2 { node-id 2; // Standby } on store3 { node-id 3; // DR } connection { net { protocol c; } host store1 address 10.10.0.240:7789; // Active host store2 address 10.10.0.241:7789; // Standby } connection { net { protocol A; sndbuf-size 1G; on-congestion pull-ahead; congestion-fill 900M; } host store2 address 10.10.0.241:7789; // Standby host store3 address 20.20.0.253:7789; // DR } connection { net { protocol A; sndbuf-size 1G; on-congestion pull-ahead; congestion-fill 900M; } host store1 address 10.10.0.240:7789; // Active host store3 address 20.20.0.253:7789; // DR } }
공유 디스크 & 원격 재해복구(SDR)
주 운영사이트의 공유디스크를 소스로 하고 타깃을 재해복구 노드로 구성하여 WAN 구간을 통해 복제하는 방식입니다. 주 사이트의 공유디스크에 접근하는 2 노드는 Active/Standby 로 구성하며 DR 노드를 제2의 Standby 노드로 구성합니다. Active-Standby 노드는 동일 가상 IP 주소(VIP)로 설정하여 리소스 기동을 노드 간 상호배제하여 운영하고 DR 측 노드는 이 VIP 로 통신하여 Active/Standby 노드의 데이터를 수신합니다.
WAN 재해복구 구성으로서 비동기 방식 프로토콜 운영과 복제 가속기(DRX) 연동을 고려해야 합니다.
resource r0{ net{ protocol A; verify-alg crc32; sndbuf-size 1G; # max buffer size is 1 / 8 of physical ram on-congestion pull-ahead; congestion-fill 950M; } floating 10.20.210.4:7788 { # VIP 사용 options { svc-autostart no; # SDR 구성간 Active,Standby에 적용 필수 옵션, 리소스 자동 시작 no } device e minor 2; disk e; meta-disk "\\\\?\\Volume{d4006597-e3d1-4685-a91b-b23a669499f4}\\"; # 양서버에서 동시 접속이 가능한 스토리지 (RAW) 볼륨 node-id 0; } floating 10.20.210.3:7788 { # DR IP 사용 options { svc-autostart yes; # SDR 구성간 DR 은 리소스 자동시작 yes } device e minor 2; disk e; meta-disk "\\\\?\\Volume{58f21aac-2b90-464e-9cea-42a25846fd56}\\"; # 내장 혹은 스토리지 (RAW 상태) 볼륨 node-id 1; } }
N:1 미러
서로 다른 노드에 위치하는 리소스들의 복제 타깃 노드를 한 노드로 지정하는 방식입니다. 개별 리소스 측면에선 1:1 미러 구성이지만 전체 운영 측면에서 N:1 미러로 정의 합니다.
소스노드 store1 에서 타깃노드를 store3 으로 지정합니다.
resource r0 { device e minor 2; disk e; meta-disk f; on store1 { node-id 0; } on store3 { node-id 2; } connection { host store1 address 10.10.0.245:7789; host store3 address 10.10.0.247:7789; } } |
소스노드 store2 에서 타깃노드를 store3 으로 지정하여 위에서 구성한 store1 과 store2 가 store3 을 타깃으로 지정하는 N:1 구성입니다.
resource r1 { device e minor 2; disk e; meta-disk f; on store2 { node-id 1; } on store3 { node-id 2; } connection { host store2 address 10.10.0.246:7790; host store3 address 10.10.0.247:7790; } } |
타깃노드 store3에선 store1과 store2 의 구성을 모두 수용합니다.
resource r0 { device e minor 2; disk e; meta-disk f; on store1 { node-id 0; } on store3 { node-id 2; } connection { host store1 address 10.10.0.245:7789; host store3 address 10.10.0.247:7789; } } resource r1 { device g minor 4; disk g; meta-disk h; on store2 { node-id 1; } on store3 { node-id 2; } connection { host store2 address 10.10.0.246:7790; host store3 address 10.10.0.247:7790; } } |
floating peer 구성
호스트 이름을 지정하지 않고 IP 주소를 기반으로 구성할 수 있습니다.
resource r0 { floating 200.200.200.6:7788 { device d minor 1; disk d; meta-disk n; node-id 0; } floating 200.200.200.7:7788 { device d minor 1; disk d; meta-disk n; node-id 1; } }
resource r0 { floating 10.10.0.251:7788 { device e minor 2; disk e; meta-disk f; node-id 0; } floating 10.10.0.252:7788 { device e minor 2; disk e; meta-disk f; node-id 1; } floating 10.10.0.253:7788 { device e minor 2; disk e; meta-disk f; node-id 2; } connection { address 10.10.0.251:7788; address 10.10.0.252:7788; } connection { address 10.10.0.251:7788; address 10.10.0.253:7788; } connection { address 10.10.0.252:7788; address 10.10.0.253:7788; } }
혼합 구성
윈도우즈와 리눅스 노드를 혼합하여 구성할 수 있습니다. DR 구축, 백업 등의 용도로 사용합니다.
resource r0 { floating-on-linux 200.200.200.6:7788 { disk /dev/sdb1; device /dev/bsr0; meta-disk internal; node-id 0; } floating-on-windows 200.200.200.7:7788 { device d minor 1; disk d; meta-disk n; node-id 1; } }
주의 사항
Windows
볼륨
복제 볼륨은 온라인(마운트)된 상태로 레터가 할당되어 있어야 합니다.
메타디스크 볼륨은 레터 또는 GUID로 지정되어 있어야 하며, RAW 포맷 상태로 준비해야 합니다. 특정 파일 시스템(예: NTFS)으로 포맷할 경우 메타 볼륨 초기화 시점에 권한 문제로 인한 초기화 오류가 발생합니다.
디스크 볼륨 크기
볼륨의 크기는 반드시 소스 노드 볼륨의 크기보다 타깃 노드 볼륨의 크기가 같거나 커야 합니다.
여기서 볼륨의 크기는 포맷한 이후의 파일시스템의 크기가 아닌 파티션의 크기를 의미하며 다음과 같이 powershell 명령라인에서 구할 수 있습니다.
Windows PowerShell
Copyright (C) 2014 Microsoft Corporation. All rights reserved.
PS C:\Users\sekim>gwmi -Query "SELECT * from Win32_DiskPartition"
NumberOfBlocks : 488392704
BootPartition : False
Name : 디스크 4번, 파티션 0번
PrimaryPartition : True
Size : 250057064448
Index : 0
NumberOfBlocks : 716800
BootPartition : True
Name : 디스크 0번, 파티션 0번
PrimaryPartition : True
Size : 367001600
Index : 0
NumberOfBlocks : 487675904
BootPartition : False
Name : 디스크 0번, 파티션 1번
PrimaryPartition : True
Size : 249690062848
Index : 1
NumberOfBlocks : 976766976
BootPartition : False
Name : 디스크 5번, 파티션 0번
PrimaryPartition : True
Size : 500104691712
Index : 0
NumberOfBlocks : 1953519616
BootPartition : False
Name : 디스크 2번, 파티션 0번
PrimaryPartition : True
Size : 1000202043392
Index : 0
NumberOfBlocks : 976766976
BootPartition : False
Name : 디스크 3번, 파티션 0번
PrimaryPartition : True
Size : 500104691712
Index : 0
NumberOfBlocks : 488392704
BootPartition : False
Name : 디스크 1번, 파티션 0번
PrimaryPartition : True
Size : 250057064448
Index : 0
노드
구성파일 host 섹션에 호스트 이름을 기술해야 합니다.(floating peer 방식은 예외)
구성파일 host 섹션에 node-id 항목이 기술되어 있어야 합니다.
네트워크
미러링 주소와 포트에 대한 로컬 방화벽 예외정책을 추가해야 합니다.
NIC 에 설정된 네트워크 주소가 net 섹션의 IP 주소로 기술되어야 합니다.
IP 주소 구성 잔재 오류
운영 상황에 따라 기존에 설정했었던 IP 주소 정보를 변경한 후 리소스를 기동(up) 할 때 “There are multiple host sections for this node“ 와 같은 오류가 발생할 수 있습니다. 이것은 Windows에서 랜카드에 설정했던 IP 주소 정보가 레지스트리에 남아 있어서 IP 주소 인식 오류가 발생하는 문제로 다음 레지스트리의 항목을 수동으로 수정하여 해결할 수 있습니다.
HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Services\Tcpip\Parameters\Interfaces 키 하부의 인터페이스 키에 설정된 IP 주소 잔재를 변경하려는 IP 주소로 설정합니다.
Linux
리눅스 DRBD 에서 구현하고 있는 I/O 재지정(redirection)은 bsr 에서 제거되었습니다. 따라서 기존 DRBD 의 diskless 모드는 지원하지 않습니다.(단지, 볼륨이 detach 된 상태의 diskless 상태만 정의됩니다.)
diskless 모드가 제거됨에 따라 로컬의 읽기 I/O도 기본 bypass 하도록 처리됩니다. 읽기 I/O 또한 재 지정되지 않습니다.