2013년 1월 21일 월요일

시시하게 끝나버린 LVM 복구

결론만 이야기하자면, 재부팅 한방으로 모든 상황이 종료되고 말았다.

만약 정상적인 재부팅 과정에서 LVM쪽에 문제가 생겨서  root password를 입력하라는 화면이 나왔다면, 커맨드 라인에서 여러가지 명령을 입력해 가면서 망가진 LVM을 되살리기 위해 노력했을 것이다.

하지만 이번의 경우는 좀 달랐다. 프로그램 실행 중에 특정 하드디스크에 오류가 발생했고, 문제가 발생한 논리 볼륨은 자동적으로 read only 상태가 되었다. 정확히는 모르겠지만 LVM과 관련한 모든 메타 데이터는 무사했고, 논리볼륨 자체에 새로 파일을 쓰거나 고치지 않았으니 원본이 그대로 남아있을 가능성이 매우 큰 상태였다.

재부팅을 하기 전에 백업이려도 하려는 의도에서 온갖 방법을 동원하여 다른 디스크에 파일을 옮겼지만, 어차피 문제가 일어난 드라이브는 인식이 되지 않는 상태여서 완벽한 백업은 기대하기 어려웠다. 그나마 네트웍 설정을 잘못 건드려서 복사가 다 끝나가는 마당에 연결이 끊기고 말았다 ㅠㅠ

에휴... 재부팅 말고는 방법이 없겠다 싶어서 일요일 밤, 과감하게 전원을 내렸다가 다시 올렸다. 디스크 체크가 진행된다. 시간이 꽤 많이 걸린다. 디스크 용량이 테라 단위로 올라간 다음에는 디스크 체크 과정을 지켜보고 있기가 어렵다. 너무 시간이 많이 걸리니까. 10% 이상 진행이 된 것을 확인한 뒤 집에 돌아가서 편한 마음으로 '내딸 서영이'나 마저 보기로 하고 차에 올랐다.

그리고 오늘 아침, 많은 비가 내리는 가운데 출근을 하여 서버가 숨겨진(?) 방 문을 열고 키보드를 두드려서 화면을 깨웠다. 오... 반가운 로그인 화면!

이번 사태를 겪으면서 몇가지의 교훈을 얻었다. 정리하자면,

  • 24시간 외부 서비스를 하는 컴퓨터는 아니니 가끔 재부팅을 해 주자. 
  • HDD는 얼마든지 오류가 발생할 수 있는 장비이다. 주기적인 백업을 반드시 하고, 특히 NAS 도입을 적극 검토하자. 사실 나는 그동안 전문 서버용으로 SCSI HDD가 있다는 것은 알았지만, "기업용" HDD라는 제품이 따로 있는 것을 전혀 몰랐다. 혹자는 일반 데스크탑 PC용이나 기업용 모두 신뢰도는 비슷하다고 하지만... 한마디로 복불복이라는 것이다. [참고자료: Google's Disk Failure Experience, 국문 요약 및 해설은 여기, 2007년도 자료라서 지금은 어떻게 달라졌는지 알 수 없지만...]
  • 그동안 체험과 인터넷 검색을 통해 쥐가 종이를 쏠듯이 단편적으로만 알고 있던 리눅스 시스템 관련 지식을 좀 더 체계적으로 확충해야겠다는 생각이 든다. 아니할 말로 내 리눅스 경력이 이제 20년이 넘어가는데(기타 연주 경력은 30년이 넘어가는구나...) 이제 뭔가 좀 보여줄 때가 되지 않았는가?

댓글 없음: