[MIP-265] refresh arp 갱신에 실패하였습니다. exitcode=-1

Subject
refresh arp 갱신에 실패하였습니다. exitcode=-1

APPLIES TO:
MCCS version: 3.3.2
OS:windows 2008 sp2 (x86)
APPs:
Disk Type: Shared or mirror,none 




SYMPTOMS
upgrade 이후 MCCS log에 ""arp 갱신에 실패하였습니다. exitcode=-1"" 출력 된다고 함.
=> commend로 refresharp vip public 명령시 error 코드 발생
=> error in pcap_findalldevs:
=> failed to get adapter interface of 022dsdj29qji232ji
MCCS upgrade 방법
=> 기존 MCCS제거 및 설치 folder 삭제
=> 신규 MCCS 설치 및 hb.json / main.json / license.xml 파일 복사
=> 이후 online 시 정상
=> relocate TEST시 standby 서버에서 접속 안된다는 이슈로 알게 됨
기존 설치된 MCCS 에서 command 로 refresh 확인시, 동일한 Error code 발견
우선 서비스를 운영하여야 하기에, MCCS 기존 버젼으로 rollback. 그래도 정상 동작 하지 못함
=> 기존 환경과 틀린 점은 fdesk 와 trusLine 이 적용되어 있었음.
=> TrusLine 은 OS에서 제거
=> fdesk 는 삭제 하지 못하고 대기
금일 확인시, fdesk 삭제 후 MCCS 정상 동작 확인
fdesk 에서 다른네트웍망이랑 통신되는거 막는 기능이 있다고 하는데, 그 부분이 스위치에 arp 갱신하는 명령을 막는 것 같음



CAUSE
[회의 & TEST 내용]
금일 Fdesk 관련 밝혀진 내용 보고 드립니다.
미라지웍스 개발자와 엔지니어 이렇게 두명과 테스트 하면서 알아낸 사항입니다.
1. refresharp 실행 실패 원인
refresharp실행하면서 디버깅과정을 거쳐 정밀하게 하나하나 값을 바꿔가며 지점을 찾아낸 결과,
바이러스나 악성코드에 의해 IP가 0.0.0.0으로 바뀌는 현상을 방지하는 보호기능과의 충돌로 판별됨
이 부분을 일시적으로 off했을때 정상 동작함
이 부분만 제거 가능하다고 하며 정책서버(fdesk서버)에서 자동 업데이트 방식으로
원격지 업데이트 가능하며 리부팅 필요없게 수정하겠다고 함
2. fdesk 설치된 상태에서 간헐적으로 나타나는 Vollock.exe Runtime error (R6016 : not enough space for thread data) 메시지가 발생
미러디스크 환경이지만 디스크 mount상태를 체크하기 위해 주기적으로 vollock /m 명령이 수행되는데,
이 부분에 있어서 fdesk와 무언가 충돌이 난것으로 판명됨.
1번서버의 경우, Trusline삭제 후 다음날 Fdesk도 삭제했지만 case를 좁히기 위해 리부팅은 하지 않은 상태.
며칠 지난 뒤 이와 같은 메시지가 발생한것으로 보아 확실히 Fdesk가 원인이라고 예상됨
개발자에게 리부팅시 들어가는 작업에 대해 물어보았고, 리부팅 후 완전히 제거되는 남아있는 3개의 프로세스의 역할에 대해 정리 요청함
이와 같은 Runtime error 메시지가 발생한 서버의 공통적인 증상 (3set발생)은 프로세스 목록에서 vollock.exe가 제거되지 않은 상태로
계속 남아 있었다는 것. 메모리 반환 안된 상태에서 그 다음 모니터링을 위한 vollock실행 처리가 계속해서 쌓이면서 문제를 야기한것으로 예상됨
1번은 종결되었다고 봐도 무방하고,
2번의 경우 개발부와 같이 좀 더 자세히 알아볼 필요가 있을것 같습니다.
미라지웍스사에서 오늘중으로 자료 준다고 했는데 아직은 안왔습니다.
vollock실행에 있어 문제가 발생되긴 했지만 그 후에 들어가는 disk 임시폴더 만드는 작업(read/write test)에서 정상이기에
모니터링 값은 정상으로 나타나는것 같다는 박현석 과장의 의견입니다.



SOLUTION
MCCSKEY-1435 refresh arp 갱신에 실패하였습니다. exitcode=-1 는 fdesk 서버의 정책 변경으로 해결 되었다고 봐지며,
다른 이슈인 fdesk 설치된 서버에서 Vollock.exe runtime error (R6016 : not enough space for thread data)가 발생되는 현상 MCCSKEY-1437 에서 다루고 있으므로
현재 이슈MCCSKEY-1435는 제공된 솔루션에서 해결된 것으로 close 하도록 하겠습니다.

Fix version : 3.5