2022년 1월 10일 월요일

gzipped fastq 파일 여러개를 cat으로 합칠 수가 있다니!

다음의 명령어가 작동을 하리라고는 전혀 생각하지 못했다.

$ cat file1.fastq.gz file2.fastq.gz file3.fastq.gz > all.fastq.gz

당연히 압축을 풀어서 파이프로 날린 뒤 다시 합치는 명령어, 즉 'zcat files... | gzip -c > all.fastq.gz'을 써야 한다고 생각했는데 그게 아니었다. zcat - gzip 명령어를 쓰면 40배는 느리다고 한다.

이에 대한 근거는 다음의 URL에서 찾을 수 있다. 가끔씩은 이렇게 생각지도 않은 효율적인 방법을 발견하기도 한다. 


처음에는 이렇게 파일을 연결할 수 있다는 것이 믿어지지 않았다. 그러나 Pierre Lindenbaum이 이미 8년 전에 확인을 해 주었다.

댓글 없음: