2022년 9월 6일 화요일

Biobank = 인체유래물은행? 그리고 유전체 데이터를 이용하려면 인체유래물은행을 통해야 한다?

Biobank에 대해서 모두가 동의하는 완벽한 정의는 존재하지 않는다. 대략 다음과 같은 정도로 그 의미가 통한다.

A biobank is generally defined as a collection of human biological samples and associated information orgarnized in a systematic way for research puposes. 출처: Handbook of Pharmacogenomics and Stratified Medicine, 2014

아예 biobank(ing)의 의미를 논하는 논문도 존재한다. 'Toward a common language for biobanking'(Eur J Hum Genet 2015)에서는 여러 근거로부터 수집된 10가지 주요 용어 정의 - biobank, sample/specimen, sample collection, study, aliqute, coded/coding, identifying information/identifiability, anonymised/anonymisation, personal data, informed conset - 를 유럽 바이오뱅크에서 일하는 560명에게 보내어(응답자는 123명) 이를 정리하였다. [Human] biobank의 의미에 대해서 가장 많은 지지를 받은 것은 다음의 두 가지이다.

Collections, repositories and distribution centers of all types of human biological samples, such as blood, tissues, cells or DNA and/or related data such as associated clinical and research data, as well as biomolecular resources, including model- and microorganisms that might contributer to the understanding of the physiology and diseases of human [BBMRI-ERIC]

An organized collection of human biological materials and assiciated information stored for one or more research purposes - [P3G]

OECD에서도 다음과 같이 biobank를 정의하였다.

 A collection of biological material and the associated data and information stored in an organized system, for a population or a large subset of a population.

Biobank가 안전하게 보관하고 분양해야 하는 가장 중요한 품목은 바로 물질적 실체가 있는 생체 샘플일 것이다. 그리고 이와 연관된 정보(associated or related information)도 필요하다. 

국내법인 생명윤리법에서는 인체유래물 또는 유전정보와 그와 관련된 역학정보, 임상정보 등을 수집·보존하여 이를 직접 이용하거나 타인에게 제공하는 기관으로 보건복지부 장관의 허가를 받은 곳을 인체유래물은행이라 정의하였다. 그리고 이를 영어로 번역하기를 biobank라 하였다. Biobank(영어)는 법으로 허가를 받을 필요가 없겠지만, 인체유래물은행(국문)은 그렇지 않다. 그리고 인체유래물은행에서는 유전정보까지 다루게 되어 있다. 간단히 결론을 내리자면, 국내에서 연구 성과물로 얻어진 인체 유래 유전체·전사체 정보 등을 수집하여 연구자에게 제공하려는 기관은 인체유래물은행 허가를 받아야 한다. 

동법 제2조 제11호에서는 인체유래물의 정의는 '인체로부터 수집하거나 채취한 조직·세포·혈액·체액 등 인체 구성물 또는 이들로부터 분리된 혈청, 혈장, 염색체, DNAm RNA, 단밸질 등을 말한다'라 하였다. 그리고 제37조 제1항에서는 인체유래물연구를 하려면 제공자로부터 서면 동의를 받아야 한다고 규정하였는데, 동의서에 포함할 사항 중 제4호에는 '인체유래물과 그로부터 얻은 유전정보(이하 "인체유래물"이라 한다)'를 포함함으로써 유전체 연구는 인체유래물연구와 같은 수준의 것이 되고 말았다. 법조문에서 '등(等)'이라는 한 글자가 얼마나 큰 위력을 갖는지는 너무나 잘 알려져 있다. 

그러나 인체유래물은행의 운영과 관련한 규정을 보면, 데이터만을 취급하는 은행의 실정이 제대로 반영되어 있지 않다. 생명윤리법 제43조 제2항에서는 다음과 같이 규정하였다.

인체유래물은행의 장은 인체유래물등을 타인에게 제공하는 경우 익명화하여야 한다. 다만, 인체유래물 기증가작 개인식별정보를 포함하는 것에 동의한 경우에는 그렇지 아니하다.

은행이 보관한 혈액 샘플을 연구 목적으로 분양하는 경우를 가정해 보자. 이것이 누구의 것인지 알 수 없도록 이름이나 주민등록번호를 삭제하여 다른 것으로 대체하는 것 이상의 익명화는 의미가 없다. 즉 이것으로 충분하다. DNA를 추출하지 못하게 특수한 화학물질 처리를 해야 된다는 무지막지한 주장이 나오지 않기를 빈다.

그러나 유전체 정보라면 어떻게 하라는 것인가? 소위 데이터3법 개정안이 통과되어서 누구나 제공자의 동의 없이도 가명화된 개인정보를 활용할 수 있게 되었다. 보건의료 데이터의 특수성을 반영하여 만들어진 가이드라인에서는, 그러나 제공자가 동의하지 않는 경우 유전체 또는 전사체 정보를 제공하지 못하게 하였다. 왜냐고? 안전한 가명처리 방법이 개발되기 전까지는 안 된다는 것이다.

비식별조치, 가명처리, 익명화 등 용어가 통일되지 않았다는 워낙 잘 알려진 문제는 논외로 하자. 일단 내가 느끼는 점은 국내에서 연구 목적으로 유전체 정보에 접근하기가 너무나 힘들다는 것이다.

UK Biobank에서 제공하는 150K 유전체 데이터는 익명화 처리가 잘 되어 있을까? 사용 권한을 얻기 위하여 연구자가 검증을 받는 절차는 매우 철저하지만, 일단 사용 권한을 획득한 다음에 얻는 유전체 데이터에는 개인 식별을 막기 위한 처리가 되어 있지는 않은 것 같다. 내가 관련 문서를 철저히 분석하여 결론을 내린 것은 아니니 혹시 잘못 파악한 것이 확인된다면 이 글을 읽는 독자는 알려주시기를! 다만 데이터를 통해서 개인을 식별하려는 시도를 하지 말고, 입수한 데이터를 제3자에게 전달하지 말라는 약속을 지키라고 하였다. 연구자에게 데이터 활용에 대한 높은 수준의 자율권을 주되 약속을 지키지 않는 경우 책임을 지게 하는 것이다. 우리나라처럼 유전체 또는 전사체 데이터에 대한 안전한 가명조치 방법이 개발될 때까지 연구자에게 제공하지 못하겠다는 것이 아니다.

실제로 비식별화를 어떻게 하는가? 개인과 관련한 정보를 분리하는 것 이상의 조치를 취하는 것 같지는 않다. 출처: Whole genome sequencing FAQ


De-identification protocol 2.4에 나타난 단락이 매우 인상적이다.

There are also certain data items which are inherently unique to a Participant – for example genetic sequence data. However, the re-identification risk posed by this type of data is in practice relatively small. Using the sequence data as an example, a researcher in possession of sequence data (or a collection of SNPs or tandem repeats) would have to possess (a) another comparable genetic sequence of the Participant from a source which identified the Participant as well as holding the genetic sequence of the Participant from UK Biobank and (b) the computing systems to match the two sequences. This is technically possible, but the actual risk of re-identification is in practice relatively small. 

UK Biobank가 제공하는 데이터에 따라서 참여자의 재식별화가 기술적으로 불가능하지 않으나, 실제로 그렇게 할 위험성은 높지 않다는 것이다. 연구를 통해 얻어진 개인의 유전 데이터는 어떤 면에서는 공공재적인 성격이 있으므로 널리 활용될 때 비로소 가치가 생긴다는 취지를 잘 반영하고 있다.

다시 인체유래물은행 이야기로 돌아가 보자. 실물 인체자원이 수집되는 각 의료기관에서 개별적으로 인체유래물은행 허가를 받아 운영하는 것은 바람직하다. 그러나 만약 이로부터 유전체 정보를 생산했다면, 중앙 집중화된 데이터 전용 인체유래물은행('인체데이터은행'이라는 별도의 이름을 쓰는 것이 바람직할 것임)에 정보를 등록하는 것이 옳지 않을까? 그리고 인체데이터은행은 서로 정보를 동기화하는 것이 바람직하지 않을까? 현행 법규에서는 연구자가 생산한 유전체 데이터를 복수의 인체데이터은행에 등록하기 위해서 기관 IRB 심의를 거쳐야 하는 것 같다. 이미 A라는 인체데이터은행에 이미 데이터 등록을 마쳤는데, 나중에 생겨난 B라는 인체데이터은행이 이 자료를 수집하려면 연구자에게 다시 기관 IRB 심의를 해 달라고 요구해야 하는 것 같다.

오늘 쓴 글의 마지막 부분은 내가 사실 관계를 완벽하게 확인한 뒤에 쓴 것은 아니다. 다만 유전체 데이터의 오남용에 대해서는 데이터 처리자에게 책임을 지도록 하고, 연구 목적으로 이를 활용하는 사람에게 장벽이 느껴지지 않게 하면 좋겠다는 뜻에서 이런 글을 쓰게 되었다. 더불어서 인체데이터은행의 활용도가 높아져야 함은 당연하다.


 

댓글 없음: