2015년 8월 25일 화요일

awk의 매력

awk는 개발자(Alfred V. Aho, Peter J. Weinberger, Brian W. Kernighan)의 머릿글자를 딴 유틸리티로서 그 자체로 완벽한 "pattern-scanning & processing language"이다. 쉼표나 탭으로 구분된 필드를 지닌 텍스트 파일을 줄 단위로 읽어들여서 패턴을 탐색한 뒤 그 여부에 따라 조작된 결과를 내보내는 도구이다.

(바이오)펄이나 (바이오)파이썬을 사용하여 훨씬 고차원적인 일을 할 수 있음이 당연하다. 반면 awk는 매우 간단한 문법으로도 이에 버금가는 일을 하기에 부족함이 없다. 요즘은 Next-Gene Sequencing 데이터를 비롯한 염기서열 데이터를 awk로 조작하는 방법에 대한 문서를 작성하고 있다. 오류를 수정하고 테스트가 끝나면 인터넷을 통해 공개할 계획이다. 약 10쪽 내외의 분량이 될 것이다.

내가 처음으로 Perl을 익히면서 독학용 교재로 삼은 것은 바로 다음의 자료이다.

Perl in 20 pages by Russell Quong

1998년에 만들어진 이 문서의 원본 사이트는 더 이상 존재하지 않는 듯. 그 이후로 제대로 돈을 주고 산 Perl 관련 책은 [펄 쿡북] [Programming the Perl DBI] [Official Guide to Programming with CGI.pm]이 전부이다. 대부분의 자잘한 실무적인 기법들은 인터넷을 뒤져셔 구한것이 전부이다. 항상 부족하지만 그래도 개인적으로는 약 15년간에 걸쳐서 많은 발전을 이루었다고 자부한다.

댓글 없음: