DRX requires sufficient free physical memory for DRX's buffering capability when installed locally in an operating machine environment. If you do not have enough free physical memory space, you should also consider adding physical memory on your production machine.
Also, if you use the compression feature to accelerate replication, you should be aware that compression can cause CPU load on the operating node. Compression can be used locally if local I / O is not heavily burdened and compression of the operating node is insignificant. However, if compression loads affect performance across the local system, you should rethink the use of compression. Compressed loads can result in an additional load of approximately 20 ~ 30% on the local I/O load. If the DRX that performs the compression is configured as a dedicated machine and separated from the operating environment, it is possible to distribute the load depending on the compression. These DRX operational policies should be based on preliminary data on the local I / O load and should be determined by preliminary investigation of the following items in the configuration environment
2.1. Prior research
2.1.1. Operating System
Windows 2008 or later, Linux CentOS 6.4 or later 64-bit platforms are supported.
2.1.2. Operating machine minimum specification
- At least 1GHz x86/x64 compatible processor (2GHz or higher recommended), minimum 4 core recommended
- At least 4G physical memory
- At least 10 GB disk
2.1.3. Replication resources
You can configure it to any size as long as memory resources allow and limit it to up to 100 channels of replication resources.
2.1.4. Measure operational server I/O load
Use the following procedure to measure the I/O load on the server.
- Measure the read/write I/O load of the server's replication target disk (average I/O, maximum I/O within a minimum of one to four weeks)
- How to measure
- Windows: Using the Performance Monitor tool Disk I/O statistical data collection
- Linux: Utilizing utilities such as iostat Collecting disk I/O statistical data
- The buffer size, compression, and encryption policy are determined based on the measurement results. See 2.3. Buffer operation policy
2.1.5. Replication Bandwidth
Replication bandwidth requires at least 10 Mbps to 100 Mbps bandwidth.
2.2. DRX configuration method
Determine how you will configure your operating environment based on I/O load and whether compression is enabled. the local configuration is common, but If the replication load is large and WAN section acceleration is required, a dedicated configuration is recommended.
2.3. Buffer operation policy
- DRX's physical buffer specification requires a preliminary investigation of network bandwidth and operating machine I/O load for instrumentation.
- Prior research item
- Average amount of I/O per active machine's resources
- Maximum I/O Amount
- Maximum I/O Duration
- The average I/O and maximum I/O values of the operating machine are the basis for building an appropriate buffering environment.
case | buffer | remarks | |
---|---|---|---|
1 | average I/O < maximum I/O < network bandwidth | 권장 버퍼 크기: 1 GByte 이상 | 예)1Gbps 대역폭, 1G Buffer = 최대 100MB/s I/O를 약 10초간 유지 가능 |
2 | average I/O < network bandwidth < maximum I/O | (최대 I/O - 대역폭) * 최대 I/O 지속시간 | 예) 평균 50MB/s I/O, 100Mbps 대역폭, 최대 200MB/s, 최대 I/O 10초간 지속 (200MB/s - 약 10MB/s) * 10초 = 약 2GB |
3 | network bandwidth < average I/O < maximum I/O | 네트워크 대역 확장 요구, 압축 기능 고려 |
DRX의 버퍼는 사전 조사한 운영 노드의 I/O 부하 수치가 감당될 수 있도록 적절한 크기로 설정되어야 합니다. 사전 조사를 바탕으로한 I/O 데이터가 확보되지 못했다면 1번 case 기준의 권장 버퍼 사양에 따라 구성 및 시범 운영을 한 후 버퍼 크기에 대한 튜닝 과정을 필요로 합니다.
만일 운영 노드의 I/O 부하가 과도하게 크고 최대 I/O 의 지속시간이 장시간(수분~수십분)에 걸쳐 발생되는 상황이라면 DRX 버퍼링으로도 감당하기 어려울 수 있습니다. 이럴 경우에는 데이터 압축에 대해 고려해야 합니다.
2.3.1 혼잡 정책
혼잡상태란 복제부하가 가중되어 DRX의 버퍼에 여유 공간이 남아 있지 않아 버퍼링이 불가한 상태를 의미합니다. 이럴 경우 DRX는 어떤 특별한 동작을 수행하지는 않으며 버퍼에 있는 복제 데이터를 원격으로 지속 전달하는 것에 주력합니다. 그리고 혼잡상태에 대한 대응은 DRBD의 혼잡정책에 맡깁니다.
혼잡(congestion)정책은 DRX의 버퍼가 혼잡상태에 진입할 경우 DRBD에서 대응하는 정책입니다. 혼잡정책을 설정하는 방법은 다음과 같습니다.
resource r0 { proxy { memlimit 1G: # DRX 버퍼 } net { on-congestion pull-ahead; # 혼잡정책 설정(Ahead 모드) congestion-fill 950M; # 혼잡인지 시점 설정(950M 바이트 데이터가 버퍼링되는 시점을 혼잡시점으로 인지) } }
DRBD의 혼잡정책은 다음의 3가지이며 WAN 구간 비동기 복제 운영 시에는 Ahead 모드의 설정을 권장 합니다.
- block: 버퍼가 비워질 때 까지(버퍼에 큐잉할 수 있을 때까지) I/O 대기 합니다. 혼잡정책을 설정하지 않았을 때의 기본값 입니다.
- disconnect: 복제 연결을 단절하고 StandAlone 상태로 진입합니다.
- pull-ahead: 지연 복제 모드로 진입합니다. 이럴 경우 복제 연결은 유지하되 복제는 중단되고 로컬 I/O는 out-of-sync로 기록하되 혼잡상황이 해제될 시 기록됬던 out-of-sync 에 대한 재동기화를 수행합니다.
2.3.2. 버퍼 조정 가이드
- DRBD의 Ahead 모드(지연복제) 비동기 복제 구성을 전제로 합니다.
- 복제 연결이 유지되는 구간의 I/O 측정치에 대해서만 계측될 수 있도록 합니다. 복제연결 단절 구간에 대한 I/O 측정치는 고려대상이 아닙니다.
- 다음의 방법을 통해 DRBD가 Ahead 모드로 진입하는 회수(혼잡 진입 회수)를 취합합니다.
- drbd 로그상의 "Congestion-fill threshold reached" 의 출력 회수 취합
- drbdsetup events2 명령을 통한 Ahead 진입 회수 확인
- 취합한 혼잡진입 회수를 기준으로 버퍼 크기를 재조정합니다. 혼잡빈도가 잦은 경우 버퍼의 크기는 더욱 증설되어야 합니다.
- 버퍼를 증설 했음에도 혼잡구간이 빈도가 낮아지지 않을 경우 압축에 대해 고려합니다.
2.3.3. 물리 메모리 사양
DRX의 물리 메모리 사양은 리소스 개수와 최대I/O, 대역폭에 따라 가변적입니다. 다음은 최대I/O 가 대역폭보다 클 경우의 DRX의 물리메모리 사양에 대한 계산식 입니다.
- 리소스 개수 * (최대 I/O(MB/s) - 대역폭(MB/s)) * 최대 I/O 지속시간 (초) + (리소스 개수 * 압축/암호화 버퍼(100MB)) + DRX 기본메모리(100MB)
최대 I/O 가 대역폭에 비해 항상 낮다면 리소스 당 버퍼의 크기를 1GB 수준으로 계산하여 물리 메모리 사양을 결정합니다.
- 리소스 개수 * 1GB + (리소스 개수 * 압축/암호화 버퍼(100MB)) + DRX 기본메모리(100MB)
다음은 WAN 100Mbps 대역폭, 최대 I/O 200MB/s , 최대 I/O 지속시간 10초 일 경우를 상정하여 물리메모리 사양을 결정하는 예시 입니다. 이 예시에서 1개의 복제 리소스 운영에 대해 요구되는 메모리는 2.1GB(4GB 권장)이며 최대 I/O가 10초 이상 지속될 시 혼잡 상태로 진입하게 됩니다.
리소스 개수 | DRX 기본 메모리 | 송신 버퍼용 메모리 | 압축/암호화 버퍼 | 메모리 요구사양 | 운영서버 메모리 권장 사양 |
---|---|---|---|---|---|
1 | 100MB | 1 * (200MB-10MB) * 10초 = 1.9GB | 1 * 약 100MB | 2 .1GB | 4GB 이상 |
5 | 100MB | 5 * (200MB-10MB) * 10초 = 9.5GB | 5 * 약 100MB | 10.1GB | 16GB 이상 |
10 | 100MB | 10 * (200MB-10MB) * 10초 = 19GB | 10 * 약 100MB | 20.1GB | 32GB 이상 |
20 | 100MB | 20 * (200MB-10MB) * 10초 = 38GB | 20 * 약 100MB | 40.1GB | 64GB 이상 |
50 | 100MB | 50 * (200MB-10MB) * 10초 = 95GB | 50 * 약 100MB | 100.1GB | 128GB 이상 |
100 | 100MB | 100 * (200MB-10MB) * 10초 = 190GB | 100 * 약 100MB | 200.1GB | 256GB 이상 |
WAN 대역폭은 실질적으로는 가변적입니다. WAN 대역폭은 일반적으로 보장 대역폭이 아닌 네트웍 상황에 따라 변동이 심한 가변대역의 특성을 가지기 때문에 통상 WAN 대역폭은 10~100Mbps 정도의 대역으로 간주하여 1MB/s ~10MB/s 로 추산하는 것이 버퍼링 관점에서 적당합니다. 또한 일정 기간 내에 측정한 최대 I/O가 복제 대역폭보다 낮다고 해서 DRX 버퍼링을 고려하지 않는 것은 바람직 하지 않습니다. 운영환경의 애플리케이션의 특성에 따라 최대 I/O가 불특정 시점에 급등하는 상황이 있을 수 있기 때문에 이런 상황에 대비하여 DRX 버퍼에 여유공간을 두고 구성하는것이 바람직 합니다.