가장 완벽한 subtyping은 whole-genome sequencing일 것이다. 물론 여기에는 많은 비용이 든다. 따라서 지난 20년 동안 꾸준히 발전한 PCR 기반의 서브타이핑 방법이 여전히 널리 쓰인다. 예를 들어 다음과 같은 것들이다.
- Mutilocus variable number tandem-repeat (VNTR) analysis
- Multilocus sequence typing (MLST)
- (기타 non-PCR 기법) RFLP, PFGE 등
Spoligotyping은 결핵균(Mycobacterium tuberculosis complex, MTBC)의 typing에 널리 쓰이는 방법이다. 결핵균의 염색체에는 36 bp의 direct repeat(DR)이 34-41 bp의 spacer를 사이에 두고 연속적으로 배열한 구조가 존재한다. DR 영역의 끝부분에 바깥쪽을 향하게 결합하는 primer를 사용하여 spacer 영역을 전부 PCR로 증폭한 뒤, 표준 결핵균주에 해당하는 H37Rv(NC_000962.3) 및 Mycobacterium bovis BCG에서 알려진 43종의 spacer에 해당하는 oligomer array에 hybridize하여 어떤 타입인지를 알아내는 방법이다.
출처: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3914561/ |
미국 CDC에서 배포한 자료인 'Spoligotyping and Mycrobacterium tuberculosis(PDF 링크)'에 좀더 상세한 설명이 나온다.
Spoligotyping에 쓰이는 염색체 부위는 어쩌다 존재하는 것이 아니다. 이것이 바로 요즘 유전자 편집 기술로서 각광을 받는 CRISPR/Cas 시스템의 CRISPR에 해당하는 것이다.
위 그림에서는 편의상 생략하였지만, 결핵균 유전체의 DR 영역에 IS6110이 삽입되어 있어 PCR로 이를 철저히 분석하는 것에 지장을 주기도 한다. 임상분리균주에 따라서 IS6110의 삽입 위치는 약간씩 다르다. 또한 CRISPR과 그 주변 영역에 결실이 일어난 균주는 negative spoligotype을 나타내기도 한다('Structure and variation of CRISPR and CRISPR-flanking regions in deleted-direct repeat region Mycobacterium tuberculosis complex strains'. BMC Genomics 2017 18:168 PMC 링크). CRISPR 영역 자체가 이렇게 변할 수도 있고, 어차피 모든 원핵생물에 이 시스템이 다 존재하는 것도 아니다. 유전체 정보가 확보된 고세균의 85%, 박테리아의 48% 정도에만 CRISPR-Cas 시스템이 있기 때문이다.
미생물의 subtyping 용도로 가장 이상적인 CRISPR은 무엇일까? 만약 bacteriophage나 plasmid가 많은 조건이라면 spacer 서열을 획득할 가능성이 커진다. 따라서 outbreak가 일어나는 시간 프레임 안에 CRISPR이 변하게 되므로 subtyping의 유용성이 줄어든다. 혹은 내부 spacer가 없어지거나, SNP가 발생하거나, 하는 등의 사고를 겪을 수도 있음을 염두어 두어야 할 것이다.
오늘 쓴 글은 다음의 리뷰 논문을 많이 참고하였다.
CRISPRs: Molecular signatures used for pathogen subtyping. Appl. Environ. Microbiol. 2014 80:430 (PMC 링크)
또한 결핵균의 genotyping marker에 대한 데이터베이스로는 SITVITWEB이 유명하다고 한다.