Table of Contents |
---|
디스크 장애
디스크 장애(오류)는 디스크의 디스크 스토리지 계층의 물리적 연결 단자가 단선되거나 미디어의 단자의 단선, 미디어 파손, 배드 섹터, SCSI 오류 등 특정한 에러가 발생하는 상황으로 인해 디스크로 수행할 얘기치 않은 장애로 인해 디스크 I/O 가 실패하는 에 오류가 발생하는 상황을 말합니다. 이러한 장애 들은 일시적으로 발생했다가 정상화 되기도 하고 영구적 장애로 이어지기도 합니다. bsr 에선 이러한 장애를 일시적 장애와 영구적 장애로 구분하고 이러한 유형에 따라 오류를 다르게 처리합니다.
일시적 장애는 스토리지 계층에서의 어떤 이유로 인해 오류가 잠시 발생 했다가 다시 정상화되는 상황입니다. 이럴 경우에는 디스크 교체가 필요한 정도의 심각한 상황이 아니기 때문에 되도록이면 서비스 운영을 지속하면서 기 발생된 에러에 대해서만 별도로 해소하고 복제는 계속 운영되도록 하는게 효율적입니다. 즉 일시적 오류 상황에서는 I/O 에러가 발생한 블록 영역을 out-of-sync 로 기록하고 해당 블록으로 발생한 재시도된 I/O 가 성공하면 자연스럽게 OOS 가 해소되도록 합니다.
영구적인 디스크 오류는 디스크 교체 등 디스크 장애에 대한 별도 조치가 필요한 상황으로 전체 재구성의 절차로 절차를 통해 복구해야 합니다.
I/O 에러 처리 정책은 리소스 <disk> 섹션의 on-io-error 옵션을 통해 설정 됩니다.
...
다음과 같이 메타 데이터 세트를 재생성하고, 리소스를 다시 연결합니다. 필요하다면 명시적으로 invalidate 를 동기화 명령을 수행하여 전체동기화를 진행합니다.
Code Block |
---|
C:\Program Files\bsr\bin>bsradm down <resource> C:\Program Files\bsr\bin>bsradm create-md <resource> v08 Magic number not found Writing meta data... initialising activity log NOT initializing bitmap New bsr meta data block sucessfully created. C:\Program Files\bsr\bin>bsradm up <resource> C:\Program Files\bsr\bin>bsradm invalidate <resource> |
...