2014년 9월 26일 금요일

생명정보 연구성과물 등록의 활성화를 위한 제언

[본 글은 한국생명공학연구원 및 국가생명연구자원정보센터(KOBIC)의 공식적 의견과 다를 수 있습니다]

우리나라의 과학기술자가 연구비를 조달하는 가장 중요한 재원은 국민이 낸 세금으로 이루어진 정부 R&D 예산이다. 구미 선진국처럼 민간의 기부금에 의한 연구비 지원이 활성화되기를 바라는 것은 아직 시기상조인 것이 현실이다. 세금은 제한된 소중한 자원이므로 중복 투자를 막아야 하고, 연구 결과물은 투명하게 공개하여 국민의 알 권리를 충족시킴과 동시에 산업발전을 위한 초석으로 쓰여야 한다. 정부에서 국가연구개발사업의 관리 등에 관한 규정을 통하여 연구성과물을 체계적으로 관리하고 효율적 활용을 하려는 것도 이러한 취지에 근거하고 있다.
 
보통 논문이나 특허, 개발품 또는 연구 보고서와 같이 연구의 최종적인 결과물만을 연구 성과물로 생각하기 쉬우나, 국가연구개발사업 등의 성과평가 및 성과관리에 관한 법률에서는 연구성과물이란 연구개발을 통하여 창출되는 특허·논문 등 과학기술적 성과와 그 밖에 유·무형의 경제·사회·문화적 성과라고 포괄적으로 정의하고 있다. 미래부에서는 이를 구체화하여 유형(실물) 및 무형(정보)8대 연구성과물을 정의하고, 관리 및 유통의 전담기관을 지정하여 운영하고 있다.
 
국가생명연구자원정보센터(KOBIC)8대 성과물 중 하나인 생명정보, 즉 유전체나 전사체, 단백체 등의 정보의 등록과 관리 및 유통의 책임을 지고 있다. 생명정보는 넓게는 생물자원의 일부로서, 생명연구자원의 확보·관리 및 활용에 관한 법률에 따라 KOBIC에서 전담하기로 규정되어 있다. 최근 차세대 유전체 염기서열 해독(NGS) 기술과 IT 기술이 발달하면서 국가연구개발사업에서 산출되는 생명정보가 급격히 증가하고 있으며, 이를 활용한 맞춤의료·헬스케어/웰니스 대국민 서비스 등 이른바 바이오 빅데이터 경제시대에 대한 기대감도 증가하고 있다. 이러한 시대적 배경과 법·제도적 근거가 충분히 마련되어 있음에도 불구하고, 생명정보 연구성과물의 등록 및 활용 실적은 크게 나아지고 있지 않다. 도대체 왜 그런 것일까?
 
첫 번째로는 정보 공유와 개방에 대한 국민적인 인식이 아직 널리 확산되지 못한데서 기인한다고 본다. 한국인 특유의 끈끈한 정이나 온정주의가 선진 사회로 진입하려는 길목에서 긍정적인 요소로 작용하는 것은 분명한 사실이지만, 자신의 테두리를 굳건하게 지키려고만 하고 서로 나누고 타협하고 토론하면서 더 큰 가치를 누리려는 문화가 사회 전반에 아직 뿌리내리지 못한 것이 큰 원인일 것이다. 국민의 세금을 통해서 만들어진 연구 성과이지만 내가 연구책임자이니 이 성과물은 내 것이라는 의식을 아직 벗어나지 못하고 있다. 내가 갖고 있는 연구성과물을 남에게 공개할 경우, 이를 재빨리 다른 성과물로 가공하여 빼앗아 갈지도 모른다는 다소 막연한 불안감이 아직 남아있는 듯하다. 아직 이런 좋지 않은 사례가 과학기술계에서 완전히 사라진 것은 아니지만, 나눔으로서 잃는 것보다 얻는 것이 더 많다는 긍정적이고 개방적인 마음가짐을 갖는 것이 중요하다.
 
두 번째로는 연구성과물 관리·유통 전담기관이 그동안 연구성과물을 보유하고 있는 연구자들에게 친숙하지 다가가지 못했다는 점이다. 성과물을 정리하여 등록하는 데에는 연구와는 별도로 수고로운 일이다(궁극적으로는 이러한 노력도 연구 과정의 일부라고 받아들이는 자세가 필요하다). 안타까운 현실이지만 이를 이행했을 때 연구자에게 실질적으로 돌아가는 혜택이 있다고 느껴져야만 등록률이 올라갈 것이다. 법률에서 등록을 하도록 규정하고 있다고 강조하고, 심지어 등록을 하지 않을 경우 제재나 벌칙을 가한다고 강조하는 것은 그다지 바람직한 형태는 아니다. 선진국의 예를 들어보자. GenBank는 미국 생명공학정보센터(NCBI)에서 유지하는 가장 오래된 생명정보 데이터뱅크이다. 염기서열이나 단백질 서열과 같은 생명정보를 다루는 학술 논문을 출판할 경우, 이를 GenBank와 같은 공공 데이터베이스에 등록·공개하는 것이 대부분 학술지의 지침이다. 이에 따라 자발적으로 정보가 한 곳으로 모이게 되고, 이렇게 모인 정보는 그 양이 늘어나면서 스스로 가치를 만들어 내고 있다. GenBank 없는 바이오 및 의료 연구를 상상할 수 있는가? 이러한 이유로 성과물의 생산자는 법으로 강제하지 않아도 자발적으로 생명정보 연구성과물을 GenBank에 등록하게 된다.
 
연구자 입장에서는 논문을 내기위해 GenBank에 등록을 하고, 국내 규정을 지키기 위해 별도로 국내의 전담기관에 등록을 하는 것을 상당히 번거롭게 느낄 수 있다. 최근 추진되는 국가연구개발사업에서는 사업관리주체가 아예 생명정보 성과물을 국내에 등록하지 않으면 연차평가에 불이익을 받도록 하는 추세이다. 이는 피상적으로는 등록률을 올리는 효과가 있지만, 이렇게 쌓인 성과물은 다른 사람이 검색하여 활용하고 재가공할 수 있도록 확산되어야만 한다. 책상 위에 놓인 엑셀 집계표 실적 숫자로만 존재하는 성과물은 의미가 없다. 이에 대해서는 주무 부처나 성과물 관리·유통 전담기관의 많은 고민과 노력이 필요하다. 등록된 정보가 실제로 국민과 연구자에게 활기 있게 되돌려 활용될 수 있는 방안을 마련하는 것이 무엇보다 중요하다. 단순한 데이터 뱅크가 아니라 부수적인 분석을 통해 새로운 가치를 부여하는 것이 필요한 시점인 것이다.
 
세 번째로는 과제 정보를 반드시 기재하게 되어있는 현행의 등록 시스템이 연구자들의 자유로운 사고와 도전을 오히려 가로막을 수도 있다는 것이다. 3M이나 구글처럼 혁신의 상징으로 알려진 기업에서는 직원이 리소스(시간 혹은 비용)15~20% 정도를 현업과 관계없는 일을 하는데 쓸 수 있도록 배려한다고 한다. 여기서 창출되는 창의적인 발상이 나중에 회사를 먹여 살릴 수도 있는 중요한 아이템으로 발전할 가능성이 있기 때문이다. 연구도 마찬가지이다. A라는 일을 하겠다고 정부 연구비를 받았으면, 그 목적에 맞는 일을 해야만 한다. 그러나 이렇게 해서는 계속 바뀌는 시대적 요청사항을 반영한 새로운 연구를 할 여지가 없다. 요즘은 정부 연구비를 따기 위해 어떤 제안을 하려고 하면 항상 <선행연구결과>를 요구하는데, 만약 그동안 하던 일과 관계가 없는 새로운 분야라고 한다면, 선행연구 결과가 있다는 것은 이전의 연구과제를 목적에 맞지 않게 사용했음을 고백하는 일이 된다.
 
바로 여기에 어려운 점이 있다. 현행 연구성과물 등록 시스템에서는 이 성과물이 산출되는데 관여한 연구과제정보를 반드시 기록하게 되어있다. 그런데 예비연구의 차원에서 일을 하다 보면 실제 성과물과 연구과제가 일치하지 않는 경우가 꽤 많이 존재한다. 매우 흔하게 겪는 사례를 들어 보자. 모 연구소의 김 박사는 여러 연구과제를 통하여 A라고 하는 우수한 세포주를 개발하였다. 당연히 NGS 기술을 이용하여 유전체 정보를 해독하고 싶었지만 연구비가 없었다. 이러한 사정을 알게 된 이 박사는 마침 시퀀싱을 맡기려던 자신의 시료 10개에 김 박사의 시료를 추가하여 큰 추가비용 없이 유전체 해독을 실시하였고, A.fastq라는 성과물을 얻었다. 비용은 이 박사의 과제 LEE0001에서 충당하였다. 물론 LEE0001 과제의 당초 계획에는 A 세포주의 연구에 대한 내용이 들어있지 않다. 이 경우, A.fastq를 연구성과물 등록 시스템에 올리고자 할 때 LEE0001 과제를 연관 과제로 입력할 것인가? 시퀀싱 결과물만을 성과물로 본다면 LEE0001을 연관 과제로 설정하는 것이 논리적으로는 틀리지 않다. 그러나 이 박사가 이 성과물에 대해 과제책임자로서 등록증을 발급받게 되면 김 박사는 매우 심기가 불편할 것이고, 이 박사 입장에서는 당초 연구 계획에 없던 성과물을 발생시킨데 대하여 부담을 느낄 수도 있다. A라는 세포주를 만드는 과정에서 다른 여러 과제가 관련되었을 수도 있는데, 이것들도 A.fastq를 생성하게 만든 과제로 간주해야 하는가? 이 점도 생각해 볼 문제이다.
 
최근 들어서는 등록된 연구성과물 자체를 평가하고자 하는 움직임까지 부처 차원에서 일어나고 있다. , 등록된 건수 위주로만 평가를 하면 의미가 없거나 함량 미달의 데이터까지 등록하는 일이 벌어지므로 이를 정성적으로도 평가하자는 것이다. 그렇다면 이 박사의 입장은 남을 도와주고도 더욱 난처한 상황이 되는 것이다. 이보다도 더 복잡한 상황을 얼마든지 주변에서 찾을 수 있다. 예를 들어 김 박사가 일년 쯤 지난 후 A 세포주에 대한 연구과제를 신청하여 KIM0002라는 과제를 드디어 따냈다고 하자. 이제 이 과제에서 박 연구원을 고용하여 A,fastq라는 raw data를 성공적으로 분석하여 A.contig라는 성과물을 창출했다고 하자. A.contig의 연관 과제는 LEE0001인가, 혹은 박 연구원의 인건비와 컴퓨터 구입 비용 및 간접비를 댄 KIM0002인가? 그리고 김 박사가 A 세포주의 유전체 분석 결과물을 훌륭하게 해석하여 좋은 학술지에 발표했다고 가정하자. 과제 평가를 앞둔 김 박사는 당연히 KIM0002 과제를 단독으로 사사하고 싶을 것이다(시퀀싱 비용에서 도움을 준 이 박사는 공저자로 들어가거나 사사에 언급될 수 있고, 이는 두 사람의 합의에 따라 결정할 일이다). 그러면 연구성과물 시스템에 등록되어 있는 A.fastq, A.contig의 재료가 된 성과물은 LEE0001이 연관 과제로 되어 있는데 왜 논문(KIM0002)과는 과제 사사가 다르냐고 과제 관리 기관에서 해명을 하라고 요구할지도 모른다. 다행히 아직은 그런 수준은 아닌 것 같다.
 
이 성과물이 어느 과제에서 산출되었나, 혹은 어느 부처에서 발주한 연구개발사업의 성과인가를 따지는 것은 엄정한 과제 관리를 위해서는 매우 중요한 사항이다. 그러나 이를 지나치게 따지다 보면, 예비연구 성격의 성과물을 등록하려는 개별 연구자들은 등록 과정에서 관련 연구과제가 도대체 어느 것인지를 고민하다가 아예 등록을 하지 않게 되는 수가 있다는 것이다.
 
따라서 연관 과제를 기재하는 것을 필수 항목으로 하지 않고 자유도를 부여하자는 것이 필자의 생각이다. 사업단 차원에서 관리를 하거나 혹은 정보 생산이 큰 비중을 차지하는 과제에서는 어차피 연차 평가를 위해서 정확한 과제 정보와 함께 자발적인 성과물 등록이 이루어질 것을 기대할 수 있다. 연구과제의 당초 목적에는 명시적으로 기록되어 있지 않다 해도 연구책임자의 자의적인 판단에 의해 생산된 생명정보(특히 새로운 분야를 대비하기 위한 성격이 강한)에 대해서는 연구과제 정보를 명시하지 않아도 무방하도록 배려해 주는 것이 반드시 필요하다고 본다.
 
이외에도 세부적이고 기술적인 면에서 결정할 사항이 존재한다. 등록된 생명정보의 현황이 어떻게 되는지는 주무부처에서는 매우 중요한 사항이지만, 연구자 측면에서는 실제 쓸 만한 정보를 풍부히 갖고 있는지가 더욱 중요하다. 등록된 생명정보를 도대체 어떤 단위로 셀 것인가? 단순히 서열의 숫자만으로 집계를 한다면, 완성도가 떨어져서 contig 혹은 scaffold가 무수히 많은 genome project가 더 우수한 성과라고 오해를 살 수 있다. 또한 전사체 정보의 경우 차등 유전자 수의 다소를 가지고서 우열을 따질 것인가? 이는 대단히 비과학적이다. 더욱 근본적으로 문제를 제기한다면 등록된 정보의 건수 자체는 그렇게 중요하지 않을 수도 있다는 것이다.
 
수치 혹은 실적에 연연하게 되면 줄세우기를 중요시하는 우리 문화에서 이는 항상 증가해야 한다는 강박에 시달리게 되고, 활용을 강조하다 보면 정보분양 실적또는 창출한 경제적 가치라는 새로운 수치로 연구성과물 등록 및 활용 시스템 자체를 평가하려고 애를 쓰게 될지도 모른다. 기술적으로 고민하고 해결해야 하는 부분은 관리 및 유통 전담 기관이 고민하여 해결해야 할 사항이고, 보다 중요한 것은 이러한 좋은 제도의 취지를 이용하고 정보를 공유하려는 분위기의 확산, 그리고 이를 촉진하는 정책적 배려가 절실하다.
 
이상과 같이 생명정보 연구성과물의 등록 및 활용성을 제고하기 위하여 해결해야 할 문제점을 몇 가지로 나누어 짚어 보았다. 이상의 사례는 필자가 수집한 200 건 이상의 유전체 데이터를 막상 등록하려다가 진행하지 못하고 있는 현실을 그대로 반영하고 있는 것이다. GenBankraw data는 물론 contig sequence까지 전부 등록하여 공개하고 논문까지 발표를 하였지만 정작 국내의 연구성과물 등록시스템에는 raw data 생산과 연관된 과제정보를 사실 그대로 기입하기가 난감하여 등록을 못하고 있는 현실을 생각해 보라.
 
비록 외국 사이트이지만 성과물이 전부 등록되어 전 세계에 공개된 상태인데 다시 수고스럽게 국내 사이트에 등록을 할 필요가 있을까?”
 
국내 사이트에 정보를 등록하면 GenBank에서 제공하지 못하는 새로운 가치를 더하거나 심층 분석을 하여 제공하는 것도 아닌데
 
이러한 우려를 불식시킬 수 있는 매력적인 정책과 서비스(정부 및 유통관리 전담기관)과 인식의 전환(연구자)이 필요하다.

댓글 없음: