[MSP-10] DRBD 오프라인시 간헐적으로 Demote 실패

Subject
DRBD 오프라인시 간헐적으로 Demote 실패

 

APPLIES TO:
DRBD version: 4.1
OS : N/A
APPs: N/A
Disk Type: N/A


SYMPTOMS

그룹 수동 페일오버시 DRBD에서 offline 실패

 failover 실패 원인:

 DRBD Secondary 명령 실행 시 아래 오류 발생

  /dev/drbd0: State change failed: (-12) Device is held open by somone 11

 해당 오류로 인해 flush가 실행 되었고 DRBD 상태가 Secondary로 바뀌지 않아 그룹 offline 되지 않음.

 

drbdsetup primary /dev/drbd0
drbdsetup secondary /dev/drbd0
연속으로 실행시키면 재현 됨.


CAUSE
코드 수정 필요.


SOLUTION
코드 수정- DRBD에서 11번 에러시 Offline에서 Timeout을 리턴 offline 재시도
다른 에러코드에서는 error
Fixed 4.1.1