bsradm
bsradm [options...] [-- [ backend-options...]] {command} {context...}
DESCRIPTION
bsradm 유틸리티는 구성 파일을 기반으로 bsr을 관리하는데 사용됩니다. 이 명령은 커널 모듈을 제어하고 디스크상의 메타 데이터를 조작하는 상위 레벨 명령을 하나 이상의 하위 레벨 명령으로 변환하여 "bsrsetup"및 "bsrmeta"유틸리티로 재지정 합니다. 명령에 따라 하나 이상의 리소스, 장치, 연결 또는 피어 장치에 대해 작동합니다. 리소스는 이름으로 지정하고 all 키워드는 모든 리소스에 대한 지정을 의미 합니다.
다음과 같은 명령 컨텍스트가 정의됩니다.
device
장치. minor 번호로 지정하거나(minor- minornumber, e.g. minor-0) 리소스/볼륨번호(resource/volume)로 지정합니다. 리소스만 지정하면 해당 문맥의 모든 장치에 대해 명령을 반복합니다.
connection
연결. 리소스:연결이름(resource:connection-name)으로 지정합니다. 리소스만 지정하면 해당 문맥의 모든 연결에 대해 명령을 반복합니다.
peer_device
피어 장치. 리소스:연결이름/볼륨번호(resource:connection-name/volume)로 지정합니다. 리소스, 장치, 연결만 지정하면 해당 문맥의 모든 피어 장치에 대해 명령을 반복합니다.
bsradm은 bsrsetup의 대부분 옵션을 알고 있으며 모든 이중 대시 옵션 또는 이중 대시 없는 옵션을 지정된 하위 수준 유틸리티에 전달합니다.
OPTIONS
-d, --dry-run
bsradm -d up resource와 같이 실제로 실행하지 않고 실행할 명령을 표시합니다. 이것은 bsrsetup 및 bsrmeta 사용법을 배우는 유용한 방법이 될 수 있습니다.
-c, --config-file file
대체 구성 파일을 사용할 수 있습니다. 기본적으로 bsradm은 다음 중에서 존재하는 첫 번째 파일을 사용합니다: /etc/bsr-90.conf, ./etc/bsr-84.conf, /etc/bsr-83.conf, /etc/bsr-82.conf, /etc/bsr-08.conf, /etc/bsr.conf.
-t, --config-to-test file
추가 구성 파일을 사용할 수 있습니다. 이 옵션은 dump 및 sh-nop 명령에서만 사용할 수 있습니다.
-s, --bsrsetup file
bsrsetup 프로그램의 전체 경로를 지정합니다. 이 옵션을 생략하면 bsradm이 먼저 같은 경로에서 찾은 다음 PATH 경로를 찾습니다.
-m, --bsrmeta file
bsrmeta 프로그램의 전체 경로를 지정합니다. 이 옵션을 생략하면 bsradm이 먼저 같은 경로에서 찾은 다음 PATH 경로를 찾습니다.
-S, --stacked
bsr에서 사용하지 않는 옵션입니다.
COMMANDS
adjust { resource}
구성 파일과 일치하도록 커널 모듈의 구성을 조정합니다. 그 결과는 모든 리소스를 중지하고 다시 시작할 때('bsradm down all' 다음에 'bsradm up all')와 동일해야 합니다. adjust 명령은 경우에 따라 구성 변경을 잘못 해석 할 수 있습니다. 안전을 위해 실제 명령을 실행하기 전에 명령이 수행 할 작업(--dry-run 옵션 사용)을 확인하십시오.
adjust-with-progress { resource}
adjust 와 동일하지만 명령 진행 과정에 대한 추가 정보를 제공합니다.
apply-al { device}
지정된 장치의 activity log 를 적용합니다.
attach { device}
하위 수준의 장치를 복제 장치로 적재합니다.
connect {connection}
피어에 대한 기존 연결을 활성화 합니다. 연결은 new-peer 명령으로 먼저 작성해야 하며 new-path 명령으로 하나 이상의 경로를 작성해야 합니다.
create-md {device}
장치의 메타 데이터를 초기화 합니다. 이것은 복제 장치를 최초 연결하기 전에 필요합니다.
cstate {connection}
현재의 연결 상태를 표시합니다.
detach {device}
복제 장치의 하위 장치를 분리합니다.
disconnect {connection}
피어 호스트와의 연결을 제거 합니다.
disk-options {device}
적재된 장치의 disk 옵션을 변경합니다.
down {resource}
이 명령을 통해 모든 볼륨과 연결 그리고 리소스 자체를 제거하여 중지 합니다.
dstate {device}
하위 장치의 현재 디스크 상태를 출력합니다.
dump {resource}
구성파일은 파싱하여 stdout 으로 출력합니다.
dump-md {device}
장치의 메타데이터를 텍스트 형식으로 덤프합니다. 비트맵과 액티비트 로그도 포함됩니다.
get-gi {peer_device}
특정 연결의 장치를 위한 생성 식별자(GI)를 출력합니다. 적재된 장치에는 bsrsetup, 적재되지 않은 장치에는 bsrmeta 를 사용합니다.
hidden-commands
명시적으로 문서화되지 않은 모든 명령을 표시합니다.
invalidate {peer_device}
장치의 로컬 데이터를 피어의 데이터로 동기화 합니다.
invalidate-remote {peer_device}
피어 장치의 데이터를 로컬 노드의 장치로 동기화 합니다.
net-options {connection}
기존 연결의 net 옵션을 변경합니다.
new-current-uuid {device}
새로운 current UUID 를 생성합니다.
outdate {device}
하위 장치의 데이터를 outdated 로 지정합니다.
pause-sync {peer_device}
로컬 일시 정지 플래그를 설정하여 로컬 장치와 피어 장치 간의 재 동기화를 중지합니다.
primary {resource}
리소스에서 노드의 역할을 primary로 변경합니다.
resize {device}
모든 노드에서 복제장치의 하위 장치 크기를 조정합니다. 이것은 check-resize 와 resize 하위 레벨 명령을 결합하여 수행합니다.
resource-options {resource}
기존 리소스의 리소스 옵션을 변경합니다.
resume-sync {peer_device}
로컬 동기화 일시 정지 플래그를 지워서 재 동기화가 재개 되도록 합니다.
role {resource}
리소스의 현재 역할을 출력합니다.
secondary {resource}
리소스의 역할을 Secondary 로 변경(강등)합니다. 만약 리소스의 복제 장치가 사용 중 이라면 리눅스에서 이 명령은 실패합니다. 윈도우즈에선 장치 사용 여부와 관계없이 강등합니다.
show-gi {peer_device}
특정 연결에서 장치의 데이터 생성 식별자를 표시합니다. 또한 출력에 대해 부연설명 합니다.
up {resource}
다음의 과정으로 리소스를 기동합니다
모든 볼륨의 activity log 적용: bsrmeta apply-al
리소스 생성: bsrsetup new-resource
복제 장치 생성: bsrsetup new-device, bsrsetup new-minor
하위 장치 적재: bsrsetup attach
모든 피어에 연결: bsrsetup connect
verify {peer_device}
온라인 검증을 시작, 중지, 또는 특정 부분에 대한 검증을 지정할 수 있습니다.
wait-connect {[device] | [connection] | [resource]}
피어 상의 장치, 연결 상의 모든 장치들, 모든 피어상의 모든 장치들이 확인 될 때까지 기다립니다.
wait-sync {[device] | [connection] | [resource]}
장치가 연결되고 최종 재 동기화 작업이 완료 될 때까지 기다립니다. 연결 및 리소스 수준에서도 사용할 수 있습니다
wipe-md {device}
장치의 bsr 메타 데이터를 지웁니다.
forget-peer {connection}
메타 데이터에서 연결되지 않은 피어에 대한 참조를 완전히 제거합니다.
bsrsetup
bsrsetup command {argument...} [option...]
DESCRIPTION
bsrsetup 유틸리티는 bsr 커널 모듈을 구성하고 현재 구성을 표시합니다. 사용자는 일반적으로 bsrsetup보다 bsr에 더 높은 수준의 인터페이스를 제공하는 bsradm 유틸리티와 상호 작용합니다. (bsradm에서 bsrsetup을 사용하는 방법을 보려면 bsradm의 --dry-run 옵션을 참조하십시오.) 일부 옵션 인수에는 일반 숫자를 지정할 때 적용되는 기본 스케일이 있습니다 (예: Kilo). 이러한 기본 스케일은 접미사 (예: M의 경우 Mega)를 사용하여 재정의 할 수 있습니다. 공통 접미사 K = 2^10 = 1024, M = 1024K 및 G = 1024M이 지원됩니다.
COMMANDS
bsrsetup attach minor lower_dev meta_data_dev meta_data_index,
bsrsetup disk-options minor
attach 명령은 하위 수준의 장치를 기존 복제 장치에 연결합니다. disk-options 명령은 연결된 하위 장치의 디스크 옵션을 변경합니다. 모두 명령 모두 bbssetup new-minor를 통해 생성된 복제 장치를 대상으로 하고 복제장치의 minor 번호로 지정합니다. lower_dev는 하위 장치의 이름입니다. meta_data_dev는 메타 데이터를 포함하는 장치의 이름이며, lower_dev와 동일 할 수 있습니다. meta_data_index는 인덱스 메타 데이터의 번호이거나 내부 메타 데이터의 경우 internal 키워드 또는 가변 크기의 외부 메타 데이터의 경우 flexible 키워드 입니다. 사용 가능한 옵션은 다음과 같습니다:
--al-extents extents
bsr은 최근 디스크 쓰기 작업을 근거로 쓰여진(active) 영역과 쓰여진 영역에 최근 다시 쓰여진(hot) 영역에 대해 관리합니다. 쓰기 I/O가 발생하면 active 영역은 디스크에 즉시 쓰면 되지만 inactive 디스크 영역은 먼저 activated 해야 하기 때문에 여기서 메타 데이터 쓰기가 필요합니다. 이 active 디스크 영역을 activity log 라고 합니다. activity log에 메타 데이터 쓰기를 저장하지만 실패한 노드를 복구할 경우 전체 activity log에 대해 다시 동기화 해야 합니다. 따라서 activity log의 크기는 primary 크래쉬 후 재 동기화에 얼마나 오래 걸릴지, 얼마나 빨리 복제 디스크의 일관성을 맞출지의 주요 요인이 됩니다. activity log는 여러 개의 4MiB 단위 세그먼트로 구성됩니다. al-extents 매개 변수는 동시에 활성화 할 수있는 세그먼트 수를 결정합니다. al-extents의 기본값은 6001이며 최소 7과 최대 65536입니다. 장치 메타 데이터를 생성한 방법에 따라 유효한 최대 값이 더 작을 수도 있습니다 (bsrmeta 참조).
유효 최대 값은 919 * (사용 가능한 온 디스크 activity log 링 버퍼 영역 / 4kB -1)이며, 기본 32KB 링 버퍼에서 최대 6433 (25GiB 이상의 데이터 포함)이 됩니다. 백엔드 스토리지 및 복제 링크가 약 5 분 이내에 재 동기화 될 수있는 양 이내에서 activity log의 크기를 유지하는 게 좋습니다. al-extents 의 크기를 변경하려면 리소스 중지(down)가 필요합니다.
--al-updates {yes | no}
이 매개 변수를 no 로 설정하면 activity log를 완전히 끌 수 있습니다. 메타 데이터 쓰기가 더 적게 필요하기 때문에 쓰기 속도가 빨라지지만, 실패한 기본 노드의 복구시 전체 장치를 재 동기화해야합니다. al-updats 의 기본값은 yes 입니다.
--disk-barrier, --disk-flushes, --disk-drain bsr에는 쓰기 요청의 순서를 처리하는 세 가지 방법이 있습니다.
disk-flushes
디스크에 쓰기 I/O 를 수행한 후 flush 를 강제하여 모든 데이터를 디스크에 기록하도록 조치합니다. 플랫폼에 따라 또는 드라이브 공급 업체에 따라 flush의 구현이 다를 수 있습니다. 예전 방식으로는 'force unit access'라고 명명되는 디스크 캐쉬를 우회하는 기술로 사용되기도 했으나 최근에은 기본적으로 디스크이 캐쉬를 비우는 작업을 통해 디스크 쓰기를 보장하는 방식으로 구현되고 있습니다. 이 옵션은 기본적으로 활성화 되어 있습니다.
disk-barrier
이 옵션을 사용하여 요청이 올바른 순서로 디스크에 기록되도록합니다. barrier는 barrier 이전에 제출 된 모든 요청이 이후에 제출 된 요청보다 앞서서 모두 디스크에 요청하도록 보장 합니다. 이는 SCSI 장치의 'tagged command queuing'과 SATA 장치의 'native command queuing'을 사용하여 구현됩니다. 일부 장치 및 장치 스택 만이 이 방법을 지원합니다. device mapper (LVM)는 일부 구성에서만 barrier를 지원합니다. disk-barrier을 지원하지 않는 시스템에서 이 옵션을 사용하면 데이터가 손실되거나 손상 될 수 있습니다. 이 옵션은 예전 리눅스 커널에서는 지원했지만 linux-2.6.36 (또는 2.6.32 RHEL6) 이후의 커널은 더 이상 disk-barrier가 지원되는지 감지할 수 없습니다. 이 옵션은 기본적으로 해제되어 있으며 명시적으로 활성화 해야 합니다.
disk-drain
쓰기 요청을 제출하기 전에 요청 큐가 "드레인"될 때까지(즉, 요청이 완료 될 때까지) 기다립니다. 이 방법을 사용하려면 요청이 완료될 떄 까지 요청들이 디스크에서 안정적이어야 합니다. 예전에는 이 옵션을 기본 활성화 하였지만 지금은 기본 옵션이 아닙니다.
이 세 가지 방법 중에서 bsr은 백업 저장 장치가 활성화하고 지원하는 첫 번째 방법을 사용합니다. 이 세 가지 옵션을 모두 해제하면 bsr은 쓰기 의존성을 신경 쓰지 않고 요청을 제출합니다. 다른 환경의 클러스터 노드에서는 I/O 스택에 따라 쓰기 요청이 다시 정렬되어 다른 순서로 제출될 수 있습니다. 이럴 경우 데이터가 손실되거나 손상될 수 있습니다. 따라서 쓰기 순서를 제어하는 세 가지 방법을 모두 해제하지 않는 것이 좋습니다.
쓰기 순서를 구성하기위한 일반적인 지침은 휘발성 쓰기 캐시가있는 일반 디스크(또는 일반 디스크 어레이)를 사용할 때 disk-barrier 나 disk-flush 를 사용하는 것입니다. 캐시가 없거나 배터리 백업 쓰기 캐시가 있는 스토리지에서는 disk-drain이 적합합니다.
--disk-timeout
데이터를 저장하는 하위 장치에 정의된 디스크 시간 내에 I/O 요청을 완료하지 못하면 bsr은 이를 실패로 처리합니다. 이 경우 하위 장치가 detach되고 장치의 디스크 상태가 diskless 상태가 됩니다. bsr이 하나 이상의 피어에 연결되어 있다면 실패한 요청이 그 중 하나에 전달됩니다. 이 옵션은 위험하며 커널 패닉으로 이어질 수 있습니다. 요청을 Abort 하고 강제로 디스크를 제거하는 것은 더 이상 요청을 완료하지도 않고 오류도 반환하지 않는 완전히 block되고 중지된 로컬 백업 장치를 위한 조치입니다. 이 상황에서는 일반적으로 하드 리셋 및 페일 오버가 유일한 방법입니다. disk-timeout의 기본값은 0이며, 이는 무한 시간 초과를 나타냅니다. 시간 초과는 0.1 초 단위로 지정됩니다.
--md-flushes
메타 데이터 장치에서 디스크 플러시 및 디스크 장벽을 활성화합니다. 이 옵션은 기본적으로 활성화되어 있습니다. disk-flush 매개 변수를 참조하십시오.
on-io-error handler
하위 레벨 장치에서 bsr이 I/O 오류에 대응하는 방식을 구성합니다. 다음과 같은 정책이 정의됩니다.
passthrough 하위 장치에서 오류가 반환될 경우 해당 블럭 계층을 OOS로 기록하고 상위 계층으로 오류를 전달합니다. 해당 오류 블럭은 보통 상위 계층에 의해 재시도 I/O가 발생 되고 재시도 시점에 성공할 경우 OOS 는 자연스럽게 해소되거나 그렇지 않을 경우 OOS 가 기록되어 남겨집니다. bsr 의 기본값 입니다.
call-local-io-error local-io-error 핸들러를 호출합니다.
detach 하위레벨 장치를 분리하고 diskless 상태로 전환합니다. diskless 상태에서는 I/O가 수행될 수 없으며 즉시 failover가 필요합니다.
resync-after minor
지정된 다른 장치가 동기화된 이후에만 장치를 재 동기화하도록 정의합니다. 기본적으로 장치간에는 동기화 순서가 정의되어 있지 않으며 모든 장치가 병렬로 재 동기화 됩니다. 하위 장치 구성, 사용 가능한 네트워크 및 디스크 대역폭에 따라 전체 재 동기화 프로세스가 느려질 수 있기 때문에 이 옵션을 사용하여 장치 간의 종속성 체인 또는 트리를 형성 할 수 있습니다.
bsrsetup peer-device-options resource peer_node_id volume
다음은 피어 장치에 영향을 주는 옵션입니다.
--c-delay-target delay_target,
--c-fill-target fill_target,
--c-max-rate max_rate,
--c-plan-ahead plan_time
재 동기화 속도를 동적으로 제어합니다. 이 메카니즘은 c-plan-ahead 매개 변수를 양수 값으로 설정하여 사용할 수 있습니다. 최대 대역폭은 c-max-rate 매개 변수에 의해 제한됩니다. c-plan-ahead 매개 변수는 bsr이 재 동기화 속도의 변화에 얼마나 빨리 적응 하는지를 정의합니다. 네트워크 왕복 시간(RTT)의 5 배 이상으로 설정해야합니다. c-fill-target이 정의되면 데이터 경로를 따라 정의 된 양의 데이터로 버퍼를 채우려고 하고 c-delay-target이 정의 된 경우 정의된 지연을 갖게 합니다. "정상" 데이터 경로에 대한 c-fill-target의 공통 값 범위는 4K ~ 100K입니다. drx를 사용하는 경우 c-fill-target 대신 c-delay-target을 사용하는 것이 좋습니다. c-delay-target 매개 변수는 c-fill-target 매개 변수가 정의되지 않거나 0으로 설정된 경우에 사용됩니다. c-delay-target 매개 변수는 네트워크 왕복 시간의 5 배 이상으로 설정해야합니다. c-max-rate 옵션은 bsr 호스트와 drx 를 호스팅하는 시스템간에 사용 가능한 대역폭 또는 사용 가능한 디스크 대역폭으로 설정해야합니다. 이 매개 변수들의 기본값은 다음과 같습니다. c-plan-ahead = 20 (0.1 초 단위), c-fill-target = 0 (섹터 단위), c-delay-target = 1 (0.1 초 단위) ) 및 c-max-rate = 102400 (KiB/s 단위).
--c-min-rate min_rate
Primary 이고 동기화 소스 인 노드는 애플리케이션 I/O 요청과 동기화 요청을 스케줄링해야 합니다. c-min-rate 매개 변수는 재 동기화 I/O에 사용할 수있는 대역폭의 양을 제한합니다. 나머지 대역폭은 응용 프로그램 I/O의 복제에 사용됩니다. c-min-rate 값이 0이면 재 동기화 I/O 대역폭에 제한이 없음을 의미합니다. 이로 인해 응용 프로그램 I/O 속도가 크게 느려질 수 있습니다. 가장 낮은 재 동기화 속도를 위해서는 1 (1 KiB/s) 값을 사용하십시오. c-min-rate의 기본값은 KiB/s 단위로 250 입니다.
--resync-rate rate
재 동기화에 사용할 수있는 대역폭을 정의합니다. bsr은 재 동기화 중에도 일반적인 응용 프로그램 I/O를 허용합니다. 재 동기화가 너무 많은 대역폭을 차지하면 응용 프로그램 I/O가 매우 느려질 수 있으며 이 매개 변수를 사용하면 이를 피할 수 있습니다. 이 옵션은 동적 재 동기화 컨트롤러가 비활성화 된 경우에만 작동합니다.
bsrsetup check-resize minor
지정된 복제 장치의 하위 장치의 현재 크기를 기억합니다. bsradm에서 사용합니다. 크기 정보는 /var/lib/bsr/bsr-minor-minor.lkbd 파일에 저장됩니다.
bsrsetup new-peer resource peer_node_id,
bsrsetup net-options resource peer_node_id
new-peer 명령은 리소스 내에 연결을 만듭니다. 리소스는 bsrsetup new-resource로 생성되어야 합니다. net-options 명령은 기존 연결의 네트워크 옵션을 변경합니다. connect 명령으로 연결을 활성화하기 전에 new-path 명령으로 하나 이상의 경로를 추가해야 합니다. 사용 가능한 옵션은 다음과 같습니다.
--after-sb-0pri policy
스플릿 브레인 시나리오가 감지되고 두 노드 중 어느 것도 Primary 역할을 수행하지 않는 경우 대응 방법을 정의합니다. 스플릿 브레인은 항상 두 노드 사이에서 결정되며 두 노드가 연결될 때 감지합니다. 정의 된 정책은 다음과 같습니다.
disconnect 단순히 연결을 끊습니다.
discard-younger-primary,
discard-older-primary 먼저 Primary 가 됬던 노드(discard-younger-primary) 또는 마지막으로 Primary 가 됬던 노드(discard-older-primary)를 폐기합니다. 만일 두 노드가 독립적으로 Primary 가 됬었다면 discard-least-changes 정책을 사용합니다.
discard-zero-changes 하나의 노드에서만 데이터를 쓴 경우 이 노드를 기준으로 재 동기화 합니다. 두 노드가 모두 데이터를 쓴 경우 연결을 끊습니다.
discard-least-changes 많은 데이터를 쓴 노드를 기준으로 동기화 합니다.
discard-node-nodename 명명된 노드를 항상 폐기합니다.
--after-sb-1pri policy
Primary 노드 1 개와 Secondary 노드 1 개로 스플릿 브레인이 감지되는 경우 대처 방법을 정의합니다. (두 노드가 연결될 때 스플릿 브레인 시나리오를 감지하므로 스플릿 브레인 결정은 항상 두 노드 중 하나입니다.) 정의 된 정책은 다음과 같습니다.
disconnect 단순히 연결을 끊습니다.
consensus 희생노드가 선택될 수 있다면 자동으로 해결합니다. 그렇지 않으면, disconnect처럼 동작합니다.
discard-secondary Secondary 의 노드를 폐기합니다.
--after-sb-2pri policy
스플릿 브레인 시나리오가 감지되고 두 노드가 모두 Primary 역할을 하는 경우 대응 방법을 정의합니다. (두 노드가 연결될 때 스플릿 브레인 시나리오를 감지하므로 스플릿 브레인 결정은 항상 두 노드 중 하나 입니다.) 정의 된 정책은 다음과 같습니다. 2 primary 스플릿 브레인의 경우 disconnect 를 통한 수동 복구만 사용할 수 있습니다.
disconnect 단순히 연결을 끊습니다.
--connect-int time
bsrsetup connect로 두 노드 간 연결이 구성되는 즉시 연결 설정을 시도합니다. 이것이 실패하면 bsr은 connect-int초 동안 기다렸다가 반복합니다. connect-int의 기본값은 3초입니다.
--csums-alg hash-algorithm
일반적으로 두 노드가 다시 동기화되면 동기화 대상은 동기화 소스로부터 out-of-sync 데이터를 요청하고 동기화 소스는 데이터를 전송합니다.
많은 사용 패턴에서 볼 때 상당수의 블록이 실제로 동일합니다. csums-alg 알고리즘이 지정되면 동기화되지 않은 데이터를 요청할 때 동기화 대상도 현재 보유한 데이터의 해시를 전송합니다. 동기화 소스는이 해시를 자기의 데이터와 비교합니다. 해시가 다르면 동기화 대상에 새 데이터를 보내고 해시가 같으면 데이터가 동일하다는 것을 알려줍니다. 이렇게 하면 필요한 네트워크 대역폭이 줄어들지만 CPU 사용률이 높아지고 SyncTarget의 읽기 I/O가 증가합니다 . csums-alg는 커널이 지원하는 보안 해시 알고리즘 중 하나로 설정 될 수 있습니다. /proc/crypto에 나열된 shash 알고리즘을 참조하십시오. 기본적으로 csums-alg는 설정되어 있지 않습니다.
--data-integrity-alg alg
bsr은 일반적으로 TCP/IP 프로토콜에 내장 된 데이터 무결성 검사에 의존하지만, 데이터 무결성 알고리즘이 구성된 경우 이 알고리즘을 사용하여 네트워크를 통해 수신 된 데이터가 발신자가 보낸 것과 일치하는지 확인합니다. 데이터 무결성 오류가 감지되면 bsr은 네트워크 연결을 닫고 다시 연결하여 재 동기화를 트리거합니다. data-integrity-alg는 커널이 지원하는 보안 해시 알고리즘 중 하나로 설정 될 수 있습니다. /proc/crypto에 나열된 shash 알고리즘을 참조하십시오. 기본적으로이 메커니즘은 해제되어 있습니다. 관련된 CPU 오버 헤드로 인해 운영 환경에서는 이 옵션을 사용하지 않는 것이 좋습니다.
--fencing fencing_policy
펜싱은 두 노드가 연결이 끊어져서 모두 Primary 가 되는 상황을 방지하기위한 예방 조치입니다. 이것은 스플릿 브레인 상황 이라고도 합니다. bsr은 다음과 같은 펜싱 정책을 지원합니다.
dont-care 펜싱 조치가 수행되지 않습니다. 이것이 기본 정책입니다.
resource-only 노드가 연결이 끊긴 Primary 노드가 되면 피어를 차단하려고 합니다. 이것은 "fence-peer" 핸들러를 호출하여 수행됩니다. 핸들러는 대체 통신 경로를 통해 피어에 도달하여 'bsradm outdate minor'를 호출해야 합니다.
resource-and-stonith 노드가 연결이 끊긴 Primary 노드가 되면 모든 IO 작업을 중지하고 fence-peer 핸들러를 호출합니다. fence-peer 핸들러는 대체 통신 경로를 통해 피어에 도달하여 'bsradm outdate minor'를 호출해야 합니다. 그렇게 할 수없는 경우에는 상대방을 (전원 제어)차단해야 합니다. 상황이 해결 되자마자 IO가 재개됩니다. 펜스 피어 핸들러가 실패한 경우 잠재적으로 스플릿 브레인이 발생했다고 판단하고 수동으로 복구해야 합니다.
--ko-count number
송신 버퍼링 시 TX 노드 측의 송신 재시도 회수를 정의합니다.
--max-buffers number
수신 측 peer-request의 최대 버퍼 크기를 정의합니다. 단위는 PAGE_SIZE(대부분의 시스템에서 4KiB)입니다. 가능한 최소 설정은 32(= 128 KiB)로 하드 코딩되어 있습니다. 이 버퍼는 디스크에 쓰거나 디스크에서 읽는 동안 데이터 블록을 보유하는 데 사용됩니다. max-buffers 페이지 이상이 사용 중이면 이 풀의 추가 할당이 제한됩니다. 수신 측에서 I/O 부하를 감당할 수 없는 경우 max-buffers를 늘려야 합니다.
--max-epoch-size number
쓰기 barrier을 발행하기 전에 bsr이 발행 할 수있는 최대 쓰기 요청 수를 정의합니다. 기본값은 2048이며 최소 1과 최대 20000입니다.이 매개 변수를 10 미만의 값으로 설정하면 성능이 저하 될 수 있습니다.
--on-congestion policy,
--congestion-fill threshold,
--congestion-extents threshold
기본적으로 bsr은 TCP 송신 큐가 가득 찬 경우 대기합니다. 이럴 경우 송신 큐를 다시 사용할 수있을 때까지 응용 프로그램에서 추가 쓰기 요청을 생성 할 수 없습니다. bsr을 프록시와 함께 사용하는 경우 전송 대기열이 가득 차기 전에 bsr을 Ahead/Behind 모드로 전환 할 수있는 Pull-ahead 혼잡 정책을 사용하는 것이 좋습니다. 그런 다음 bsr은 비트 맵에 자신과 피어의 차이점을 기록하지만 더 이상 피어에 복제하지 않습니다. 충분한 버퍼 공간이 다시 사용 가능 해지면 노드는 피어와 재 동기화되고 정상 복제로 다시 전환됩니다. 이는 대기열이 가득 차더라도 응용 프로그램 I/O를 차단하지 않는 이점이 있지만 피어 노드가 원본에 비해 훨씬 더 뒤쳐 질 수 있다는 단점이 있습니다. 그리고 재 동기화하는 동안은 피어 노드가 Inconsistent 상태입니다. 사용 가능한 혼잡 정책은 blocking(기본값), disconnect, pull-ahead 입니다. congestion-fill 매개 변수는이 연결에서 복제 중인 데이터가 허용되는 양을 정의합니다. 기본값은 0(혼잡 제어 메커니즘을 사용하지 않도록 설정합니다)이며 최대 1TB입니다. congestion-extents 매개 변수는 Ahead/Behind 모드로 전환하기 전에 활성화 될 수있는 비트 맵 범위의 수를 정의합니다. congestion-extents 매개 변수는 al-extents 보다 작은 값으로 설정 한 경우에만 유효합니다.
--ping-int interval
피어에 대한 TCP/IP 연결이 1 초 이상 유휴 상태 인 경우 bsr은 ping 패킷을 보내 실패한 피어 또는 네트워크 연결이 빨리 감지 되도록 합니다. 기본값은 3초이며 최소 1과 최대 120 초입니다. 단위는 초입니다.
--ping-timeout timeout
ping 패킷에 대한 회신 시간 초과를 정의합니다. 피어가 ping 시간 초과 내에 응답하지 않으면 bsr이 연결을 닫고 다시 연결하려고 시도합니다. 기본값은 3초이며 최소 0.1 초와 최대 3 초입니다. 단위는 10분의 1초입니다.
--protocol name
복제 연결에 지정된 프로토콜을 정의합니다. 지원되는 프로토콜은 다음과 같습니다.
A 로컬 디스크 및 TCP/IP 전송 버퍼에 복사한 즉시 로컬 I/O 를 완료합니다.
B 로컬 디스크에 기록하고 피어에서 복제 데이터를 수신하는 즉시 ACK 를 반환합니다. 로컬에서 ACK 를 수신하면 I/O 를 완료 합니다.
C 로컬 디스크에 기록하고 피어에서 복제 데이터를 디스크에 기록한 후 쓰기 ACK 를 반환합니다. 로컬에서 쓰기 ACK 를 수신하면 I/O 를 완료합니다.
--rcvbuf-size size
TCP/IP 수신 버퍼의 크기를 구성합니다. 값이 0(기본값)이면 버퍼 크기가 동적으로 조정됩니다. 이 매개 변수는 일반적으로 설정하지 않아도 되지만 최대 10MiB의 값으로 설정할 수 있습니다. 기본 단위는 바이트이며 윈도우즈에선 지원하지 않습니다.
--sndbuf-size size
송신 작업자 쓰레드에서 할당하는 TX 버퍼의 크기를 설정합니다. 최대 1TB 까지 설정할 수 있습니다.
--tcp-cork
기본적으로 bsr은 tcp-cork 옵션을 사용하여 커널이 작은 메시지를 보내지 못하게 합니다. 이로 인해 네트워크 상에서 패킷의 크기가 커집니다. 이 최적화로 일부 네트워크 스택의 성능이 저하 될 수 있으며 패킷을 모으는 시간 동안의 지연이 발생합니다. tcp-cork 매개 변수를 사용하여 이 최적화를 해제 할 수 있습니다.
--timeout time
네트워크를 통한 응답 시간 초과를 정의합니다. 피어 노드가 지정된 시간 초과 내에 예상 응답을 보내지 않으면 응답이없는 것으로 간주하고 TCP/IP 연결을 닫습니다. 시간 초과 값은 connect-int보다 낮아야 하고 ping-int보다 작아야 합니다. 기본값은 5초이고 10분의 1초로 단위로 지정됩니다.
--use-rle
use-rle 는 run length encoding 을 사용해야 하는지 결정합니다. 클러스터 노드의 각 복제 된 장치에는 각 피어 장치에 대한 별도의 비트 맵이 있습니다. 비트 맵은 로컬 장치와 피어 장치의 차이점을 추적하는 데 사용됩니다. 클러스터 상태에 따라 장치의 비트 맵, 피어 장치의 비트 맵 또는 두 비트 맵에서 디스크 범위가 피어와 다른 것으로 표시 될 수 있습니다. 두 클러스터 노드가 연결되면 서로의 비트 맵을 교환하고 각각 로컬 및 피어 비트 맵의 합집합을 계산하여 전체 차이를 결정합니다. 매우 큰 장치의 경우 비트맵이 비교적 크기 때문에 일반적으로 run length encoding을 사용하여 압축률을 높이고 이를 통해 비트 맵 전송에 필요한 시간과 대역폭을 절약 할 수 있습니다. 기본적으로 활성화 되어 있습니다.
--verify-alg hash-algorithm
온라인 검증 (bsradm verify)은 디스크 블록 (즉, 해시 값)의 체크섬을 계산하고 비교하여 서로 다른지를 감지합니다. verify-alg 매개 변수는 이러한 체크섬에 사용할 알고리즘을 결정합니다. 온라인 검증을 사용하기 전에 커널이 지원하는 보안 해시 알고리즘 중 하나로 설정해야합니다. /proc/ crypto에 나열된 shash 알고리즘을 참조하십시오. 운영 부하가 적은 시점에 정기적으로(예 : 한 달에 한 번) 온라인 확인을 예약하는 것이 좋습니다.
bsrsetup new-path resource peer_node_id local-addr remote-addr
new-path 명령은 연결 내에 경로를 만듭니다. 연결은 bsrsetup new-peer로 생성 되어야 합니다. local-addr 및 remote-addr는 [address-family:] address[:port] 형식의 로컬 및 원격 프로토콜, 네트워크 주소 및 포트를 기술해야 합니다. ipv4, ipv6가 지원됩니다. 주소 패밀리를 지정하지 않으면 "ipv4"로 가정됩니다. ipv6을 제외한 모든 주소 계열의 경우 주소는 IPv4 주소 표기법 (예 : 1.2.3.4)을 사용합니다. ipv6의 경우 주소는 괄호로 묶고 IPv6 주소 표기법을 사용합니다 (예 : [fd01 : 2345 : 6789 : abcd :: 1]). 포트의 기본값은 7788입니다.
bsrsetup connect resource peer_node_id
connect 명령은 연결을 활성화합니다. 즉, bsr 드라이버는 연결 경로의 모든 로컬 주소를 바인딩하고 수신합니다. 하나 이상의 연결 경로를 설정하려고 시도합니다. 사용 가능한 옵션은 다음과 같습니다.
--tentative
실제로 연결을 하거나 재 동기화를 하지 않고 피어에 대한 연결을 설정할 수 있는지 그리고 재 동기화가 필요한지(및 어느 방향으로 할지) 결정합니다. 시스템 로그를 확인하여 --tentative 옵션 없이 bsr이 수행 할 작업을 미리 확인할 수 있습니다.
--discard-my-data
로컬 데이터를 버리고 최신 데이터를 가진 피어와 다시 동기화합니다. 스플릿 브레인 상황에서 수동으로 복구하려면 이 옵션을 사용하십시오.
bsrsetup del-peer resource peer_node_id
del-peer 명령은 리소스에서 연결을 제거합니다.
bsrsetup del-path resource peer_node_id local-addr remote-addr
del-path 명령은 연결에서 경로를 제거합니다. 그러나 이미 연결된 connection 을 유지해야 할 경우 이 명령은 실패합니다. 모든 경로를 제거하려면 먼저 연결을 끊어야 합니다.
bsrsetup cstate resource peer_node_id
연결의 현재 상태를 표시합니다. 연결은 피어의 node-id로 식별됩니다.
bsrsetup del-minor minor
복제 장치를 제거합니다. 이 후 더이상 하위 장치는 적재되어 있지 않을 것 입니다.
bsrsetup del-resource resource
리소스를 제거합니다. 이를 위해 모든 볼륨과 연결을 먼저 제거해야합니다(bsrsetup del-minor, bsrsetup disconnect). 또는 bsrsetup down 을 사용하여 모든 볼륨,연결과 함께 리소스를 제거 할 수 있습니다.
bsrsetup detach minor
복제 장치에서 하위 장치를 분리합니다. 사용 가능한 옵션은 다음과 같습니다.
--force 분리를 강제로 수행하고 즉시 반환합니다. 이렇게 하면 보류중인 모든 I/O가 완료 될 때까지 하위 장치를 실패 상태로 만든 다음 장치를 분리합니다. 하위 장치에 아직 제출되지 않은 I/O(예: 장치의 I/O가 일시 중단 되었기 때문에)는 실패한 것으로 간주됩니다.
bsrsetup disconnect resource peer_node_id
피어 호스트에 대한 연결을 제거합니다. 연결은 피어의 node-id로 식별됩니다.
bsrsetup down {resource | all}
모든 볼륨, 연결 및 리소스 자체를 제거하여 리소스를 중지합니다.
bsrsetup dstate minor
하위 장치의 현재 디스크 상태를 표시합니다.
bsrsetup events2 {resource | all}
구성된 모든 bsr 객체의 현재 상태와 상태의 모든 변경 사항을 표시합니다. 출력은 이벤트의 종류로 시작합니다. 기존의 객체가 생성, 파괴 또는 변경 될 경우, 이벤트 핸들러가 호출되거나 리턴되는 등의 이벤트 유형이 있습니다. 그 다음은 이벤트가 적용되는 리소스, 장치, 연결, 피어 장치, helper 객체를 기술합니다. 나머지는 개체를 식별하고 개체의 상태를 표시합니다. 다음의 사용 가능한 옵션이 있습니다.
--now 현재 상태를 보고 한 후 종료합니다. 기본값은 지속적으로 상태 변경을 보는 것입니다.
--statistics 출력에 통계를 포함 시킵니다.
bsrsetup get-gi resource peer_node_id volume
특정 연결에서 장치의 데이터 생성 식별자를 표시합니다. 장치는 볼륨 번호로 식별되고 연결은 엔드 포인트로 식별됩니다. "bsrsetup connect"명령을 참조하십시오. 출력은 현재 UUID, 비트 맵 UUID 및 플래그 세트로 구성된 처음 두 개의 히스토리 UUIDS로 구성됩니다. 현재 UUID 및 히스토리 UUID는 장치마다 다릅니다. 비트 맵 UUID 및 플래그는 피어 장치마다 다릅니다. 이 명령은 처음 두 개의 히스토리 UUID 만 표시합니다. bsr은 내부적으로 가능한 각 피어 장치마다 하나의 히스토리 UUID를 유지합니다.
bsrsetup invalidate minor
장치의 로컬 데이터를 피어의 데이터로 동기화 합니다. 피어의 파일시스템에서 사용하는 모든 공간이 동기화되지 않은 것으로 표시되고 지정된 로컬 데이터로 재 동기화 합니다.
bsrsetup invalidate-remote resource peer_node_id volume
피어의 데이터를 로컬 데이터로 동기화 합니다. 로컬의 파일시스템에서 사용하는 모든 공간이 동기화되지 않은 것으로 표시되고 지정된 피어 데이터로 재 동기화 합니다.
bsrsetup new-current-uuid minor
새로운 현재 UUID를 생성하고 다른 모든 UUID 값을 회전시킵니다. 사용 가능한 옵션은 다음과 같습니다.
--clear-bitmap
새로운 현재 UUID를 생성하고 동기화 비트맵을 지웁니다. 비트맵 GI를 제거하여 초기 동기화를 건너뛰는 데 사용할 수 있습니다. 이 방식은 이제 막 생성된 메타 데이터에서 만 작동합니다.
bsrsetup new-minor resource minor volume
리소스 내에 새로운 복제 장치를 만듭니다. 이 명령은 복제 장치(기본적으로 /dev/bsr minor)에 대한 블록 장치 inode를 만듭니다. 볼륨 번호는 리소스 내의 장치를 식별합니다.
bsrsetup new-resource resource node_id,
bsrsetup resource-options resource
new-resource 명령은 새로운 리소스를 만듭니다. resource-options 명령은 기존 리소스의 리소스 옵션을 변경합니다. 사용 가능한 옵션은 다음과 같습니다.
--auto-promote bool-value
bsr 에선 지원하지 않습니다.
--cpu-mask cpu-mask
bsr 에선 지원하지 않습니다.
--on-no-data-accessible policy
요청 된 데이터를 로컬에 접근할 수 없는 경우(예 : 모든 디스크에 장애가 발생한 경우) I/O 요청을 처리하는 방법을 결정합니다. bsr 에선 지원하지 않습니다.
--peer-ack-window value
각 노드와 각 장치에서 bsr은 각 피어 장치에 대한 로컬 데이터와 원격 데이터의 차이점에 대한 비트 맵을 유지합니다. 예를 들어, 단일 장치가 있는 3노드 설정(노드 A, B, C)에서 모든 노드는 각 피어에 대해 하나의 비트 맵을 유지합니다. 노드가 쓰기 요청을 받으면 쓰기 노드에 대한 비트 맵을 업데이트하는 방법을 알고 있지만 다른 노드들 간의 비트맵을 업데이트하는 방법은 알지 못합니다. 이 예제에서 쓰기 요청이 노드 A에서 B와 C로 전파 될 때 노드 B와 C는 노드 A와 동일한 데이터를 가지고 있지만 둘 다 동일한 데이터를 가지고 있는지 여부는 알지 못합니다. 이에 대한 해결책으로, 쓰기 노드는 때때로 peer-ack 패킷을 피어로 보내 서로에게 어떤 상태인지 알려줍니다. peer-ack-window 매개 변수는 peer-ack 패킷을 보내기 전에 Primary 노드가 전송할 수 있는 데이터의 양을 지정합니다. 값이 낮으면 네트워크 트래픽이 증가합니다. 값이 크면 네트워크 트래픽은 줄어들지 만 Secondary 노드의 메모리 소비는 증가하고 Primary 노드 장애 후 Secondary 노드 간의 재 동기화 시간이 길어집니다. (참고 : peer-ack 패킷은 다른 이유로 인해 전송 될 수도 있습니다 (예 : 멤버쉽 변경 또는 “peer-ack-delay 타이머"의 만료). peer-ack-window의 기본값은 2MiB이며, 기본 단위는 섹터임).
--peer-ack-delay expiry-time
마지막으로 완료된 쓰기 요청 후에 만기 시간 동안 새로운 쓰기 요청이 발행되지 않으면 peer-ack 패킷이 전송됩니다. 타이머가 만료되기 전에 새로운 쓰기 요청이 발행되면 타이머는 만료 시간으로 재설정됩니다. (참고 : 멤버십 변경 또는 "peer-ack-window"옵션과 같은 다른 이유로 peer-ack 패킷이 전송 될 수도 있습니다) 이 매개 변수는 원격 노드의 재 동기화 동작에 영향을 줄 수 있습니다. 피어 노드는 AL 익스텐트에서 잠금을 해제하기 위해 peer-ack 을 받을 때까지 기다려야합니다. 피어 간의 재 동기화 작업이 이러한 잠금을 기다려야 할 수도 있습니다. peer-ack-delay의 기본값은 100 밀리 초이며 기본 단위는 밀리 초입니다.
bsrsetup outdate minor
Mark the data on a lower-level device as outdated. This is used for fencing, and prevents the resource the device is part of from becoming primary in the future. See the --fencing disk option.
bsrsetup pause-sync resource peer_node_id volume
Stop resynchronizing between a local and a peer device by setting the local pause flag. The resync can only resume if the pause flags on both sides of a connection are cleared.
bsrsetup primary resource
리소스에서 노드의 역할을 primary로 변경합니다. 이를 통해 이 리소스의 복제 장치를 쓰기 위해 마운트하거나 열 수 있습니다. 사용 가능한 옵션:
--overwrite-data-of-peer 이 옵션은 --force option의 alias 입니다.
--force Force the resource to become primary even if some devices are not guaranteed to have up-to-date data. This option is used to turn one of the nodes in a newly created cluster into the primary node, or when manually recovering from a disaster. Note that this can lead to split-brain scenarios. Also, when forcefully turning an inconsistent device into an up-to-date device, it is highly recommended to use any integrity checks available (such as a filesystem check) to make sure that the device can at least be used without crashing the system. Note that bsr usually only allows one node in a cluster to be in primary role at any time; this allows bsr to coordinate access to the devices in a resource across nodes. The --allow-two-primaries network option changes this; in that case, a mechanism outside of bsr needs to coordinate device access.
bsrsetup resize minor
Reexamine the size of the lower-level devices of a replicated device on all nodes. This command is called after the lower-level devices on all nodes have been grown to adjust the size of the replicated device. Available options:
--assume-peer-has-space Resize the device even if some of the peer devices are not connected at the moment. bsr will try to resize the peer devices when they next connect. It will refuse to connect to a peer device which is too small.--assume-cleanDo not resynchronize the added disk space; instead, assume that it is identical on all nodes. This option can be used when the disk space is uninitialized and differences do not matter, or when it is known to be identical on all nodes. See the bsrsetup verify command.
--size val This option can be used to online shrink the usable size of a bsr device. It's the users responsibility to make sure that a file system on the device is not truncated by that operation.
--al-stripes val These options may be used to change the layout of the activity log online. In case of internal meta data this may invovle shrinking the user visible size at the same time (unsing the --size) or increasing the avalable space on the backing devices.
bsrsetup resume-io minor
Resume I/O on a replicated device. See the --fencing net option.
bsrsetup resume-sync resource peer_node_id volume
Allow resynchronization to resume by clearing the local sync pause flag.
bsrsetup role resource
Show the current role of a resource.
bsrsetup secondary resource
Change the role of a node in a resource to secondary. This command fails if the replicated device is in use.
bsrsetup show {resource | all}
Show the current configuration of a resource, or of all resources. Available options:
--show-defaults Show all configuration parameters, even the ones with default values. Normally, parameters with default values are not shown.
bsrsetup show-gi resource peer_node_id volume
Show the data generation identifiers for a device on a particular connection. In addition, explain the output. The output otherwise is the same as in the bsrsetup get-gi command.
bsrsetup state
This is an alias for bsrsetup role. Deprecated.
bsrsetup status {resource | all}
Show the status of a resource, or of all resources. The output consists of one paragraph for each configured resource. Each paragraph contains one line for each resource, followed by one line for each device, and one line for each connection. The device and connection lines are indented. The connection lines are followed by one line for each peer device; these lines are indented against the connection line. Long lines are wrapped around at terminal width, and indented to indicate how the lines belongs together. Available options:
--verbose Include more information in the output even when it is likely redundant or irrelevant.
--statistics Include data transfer statistics in the output.
--color={always | auto | never} Colorize the output. With --color=auto, bsrsetup emits color codes only when standard output is connected to a terminal.
For example, the non-verbose output for a resource with only one connection and only one volume could look like this:
bsr0 role:Primary disk:UpToDate host2.example.com role:Secondary disk:UpToDate
With the --verbose option, the same resource could be reported as:
bsr0 node-id:1 role:Primary suspended:no volume:0 minor:1 disk:UpToDate blocked:no host2.example.com local:ipv4:192.168.123.4:7788 peer:ipv4:192.168.123.2:7788 node-id:0 connection:WFReportParams role:Secondary congested:no volume:0 replication:Connected disk:UpToDate resync-suspended:no
bsrsetup suspend-io minor
Suspend I/O on a replicated device. It is not usually necessary to use this command.
bsrsetup verify resource peer_node_id volume
Start online verification, change which part of the device will be verified, or stop online verification. The command requires the specified peer to be connected. Online verification compares each disk block on the local and peer node. Blocks which differ between the nodes are marked as out-of-sync, but they are not automatically brought back into sync. To bring them into sync, the resource must be disconnected and reconnected. Progress can be monitored in the output of bsrsetup status --statistics. Available options:
--start position Define where online verification should start. This parameter is ignored if online verification is already in progress. If the start parameter is not specified, online verification will continue where it was interrupted (if the connection to the peer was lost while verifying), after the previous stop sector (if the previous online verification has finished), or at the beginning of the device (if the end of the device was reached, or online verify has not run before). The position on disk is specified in disk sectors (512 bytes) by default.
--stop position Define where online verification should stop. If online verification is already in progress, the stop position of the active online verification process is changed. Use this to stop online verification. The position on disk is specified in disk sectors (512 bytes) by default. Also see the notes on data integrity in the bsr.conf(5) manual page.
bsrsetup wait-connect-volume resource peer_node_id volume,
bsrsetup wait-connect-connection resource peer_node_id,
bsrsetup wait-connect-resource resource,
bsrsetup wait-sync-volume resource peer_node_id volume,
bsrsetup wait-sync-connection resource peer_node_id,
bsrsetup wait-sync-resource resource
The wait-connect-* commands waits until a device on a peer is visible. The wait-sync-* commands waits until a device on a peer is up to date. Available options for both commands:
--degr-wfc-timeout timeout Define how long to wait until all peers are connected in case the cluster consisted of a single node only when the system went down. This parameter is usually set to a value smaller than wfc-timeout. The assumption here is that peers which were unreachable before a reboot are less likely to be reachable after the reboot, so waiting is less likely to help. The timeout is specified in seconds. The default value is 0, which stands for an infinite timeout. Also see the wfc-timeout parameter.
--outdated-wfc-timeout timeout Define how long to wait until all peers are connected if all peers were outdated when the system went down. This parameter is usually set to a value smaller than wfc-timeout. The assumption here is that an outdated peer cannot have become primary in the meantime, so we don't need to wait for it as long as for a node which was alive before. The timeout is specified in seconds. The default value is 0, which stands for an infinite timeout. Also see the wfc-timeout parameter.
--wait-after-sb This parameter causes bsr to continue waiting in the init script even when a split-brain situation has been detected, and the nodes therefore refuse to connect to each other.
--wfc-timeout timeout Define how long the init script waits until all peers are connected. This can be useful in combination with a cluster manager which cannot manage bsr resources: when the cluster manager starts, the bsr resources will already be up and running. With a more capable cluster manager such as Pacemaker, it makes more sense to let the cluster manager control bsr resources. The timeout is specified in seconds. The default value is 0, which stands for an infinite timeout. Also see the degr-wfc-timeout parameter.
bsrsetup forget-peer resource peer_node_id
The forget-peer command removes all traces of a peer node from the meta-data. It frees a bitmap slot in the meta-data and make it avalable for futher bitmap slot allocation in case a so-far never seen node connects. The connection must be taken down before this command may be used. In case the peer re-connects at a later point a bit-map based resync will be turned into a full-sync.
bsrmeta
bsrmeta [--force] [--ignore-sanity-checks] { device} {v06 minor | v07 meta_dev index | v08 meta_dev index | v09 meta_dev index} { command} [cmd args...]
DESCRIPTION
The bsrmeta utility is used for creating, displaying, and modifying bsr's on-disk metadata. Users usually interact with the bsradm utility, which provides a more high-level interface to bsr than bsrmeta. (See bsradm's --dry-run option to see how bsradm uses bsrmeta.)This utility can only be used on devices which are not currently in use by the kernel.The first argument ( device) specifies the bsr device associated with a volume, or “-” if no device is associated with that volume. If the bsr device is specified, the bsrmeta utility makes sure that the bsr device does not currently have a volume attached to prevent meta-data of an active volume from being destroyed.The second argument specifies the metadata version to use (v06, v07, v08, v09). In most metadata versions, the third argument ( meta_dev) specifies the device which contains the metadata; this argument can be the same as device. The fourth argument ( index) can be one of the keywords internal (for internal metadata), flex-internal (in v07 for variable-sized metadata; v07 otherwise defaults to fixed-size internal metadata), flex-external (for variable-sized external metadata), or a numeric matadata index (for fixed-size external metadata). See the meta-disk parameter in bsr.conf(5).
OPTIONS
--force
Assume yes as the answer to all questions bsrmeta would ask.
--ignore-sanity-checks
Normally, bsrmeta performs some sanity checks before writing to the metadata device: for example, if the device appears to contain a file system, it refuses to destroy the file system by writing into it. Use this option to ignore these checks.
COMMANDS
create-md [--peer-max-bio-size=val] (metadata versions v06, v07, and v08),
create-md {number-of-bitmap-slots} [--peer-max-bio-size=val] [ --al-stripes=val] [--al-stripe-size-kB= val] (metadata version v09)
Initialize the metadata. This is necessary before a bsr resource can be attached. If bsrmeta finds an older version of bsr metadata on the device, it asks if the format should be converted. When bsradm calls bsrmeta's create-md command for a device, it sets the number-of-bitmap-slots argument to the number of peers in the resource. To reserve additional bitmap slots (which allows to add more peers in the future), call bsrmeta directly instead. When a device is used before being connected to its peers the first time, bsr assumes that peers can only handle 4 KiB requests by default. The --peer-max-bio-size option allows to set more optimistic values; use this if the versions of bsr that this device will connect to are known. bsr supports a maximum bio size of 32 KiB since version 8.3.8, of 128 KiB since version 8.3.9, and of 1 MiB since version 8.4.0. If you want to use more than 6433 activity log extents, or live on top of a spriped RAID, you may specify the number of stripes ( --al-stripes, default 1), and the stripe size ( --al-stripe-size-kB, default 32). To just use a larger linear on-disk ring-buffer, leave the number of stripes at 1, and increase the size only:
bsrmeta 0 v08 /dev/vg23/lv42 internal create-md --al-stripe-size 1M To avoid a single "spindle" from becoming a bottleneck, increase the number of stripes, to achieve an interleaved layout of the on-disk activity-log transactions. What you give as "stripe-size" should be what is a.k.a. "chunk size" or "granularity" or "strip unit": the minimum skip to the next "spindle".
bsrmeta 0 v08 /dev/vg23/lv42 internal create-md --al-stripes 7 --al-stripe-size 64
get-gi [--node-id=id]
Show the data generation identifiers for a device on a particular connection. bsr version 9.0.0 and beyond support multiple peers; use the node-id option to define which peer's data generation identifiers to show.
show-gi [--node-id=id]
Similar to get-gi, but with explanatory information.
dump-md
Dump the metadata of a device in text form, including the bitmap and activity log.
outdate
Mark the data on a lower-level device as outdated. See bsrsetup(8) for details.
dstate
Show the current disk state of a lower-level device.
check-resize
Examine the device size of a lower-level device and its last known device size (saved in /var/lib/bsr/bsr-minor-minor.lkbd by bsrsetup check-resize). For internal metadata, if the size of the lower-level device has changed and the metadata can be found at the previous position, move the metadata to the new position at the end of the block device.
apply-al
Apply the activity log of the specified device. This is necessary before the device can be attached by the kernel again.
EXPERT COMMANDS
The bsrmeta utility can be used to fine tune metdata. Please note that this can lead to destroyed metadata or even silent data corruption; use with great care only.
set-gi gi [--node-id=id]
Set the generation identifiers. The gi argument is a generation counter for the v06 and v07 formats, and a set of UUIDs for v08 and beyond. Accepts the same syntax as in the get-gi output. bsr version 9.0.0 and beyond support multiple peers; use the --node-id option to define which peer's data generation identifiers to set.
restore-md dump_file
Replace the metadata on the device with the contents of dump_file. The dump file format is defined by the output of the dump-md command.
bsrcon
bsrcon command {argument...}
DESCRIPTION
COMMANDS
/nodelayedack [ip|guid]
/delayedack_enable [ip|guid]
/m [letter] : mount
/get_log [ProviderName]
/minlog_lv dbg [Level : 0~7]
/write_log [ProviderName] "[LogData]"
/handler_use [0,1]
/bsrfsflt_status
/info
/status