2018년 1월 31일 수요일

[하루에 한 R] PhyloSift 결과 종합하기(tab-delimited CSV 파일의 일괄 입력 및 병합 등)

Species boundary를 살짝 넘어가는 박테리아 유전체 50개 정도를 가지고 whole genome phylogenetic tree를 그려보고자 하였다. Harvest suite로 분석을 하면 MUMi distance cutoff에 미치지 못하는(default = 0.1) 몇 개가 빠져나가고, Roary로는 아예 core gene이 잡히질 않았다(뭘 잘못했나?). 상위 genus에서 폭넓게 분포하는 어떤 마커들의 분포(LS-BSR로 자료 생성)를 시각화하는 것이 목표라서 tree는 아주 정확할 필요가 없다. 다만 모든 샘플을 아우를 정도로만 윤곽을 잡아주면 된다.

16S rRNA gene sequence로는 해상도가 좋은 트리가 나오기 어려울 것이 자명하다. 그래서 택한 도구는 PhyloSift였다. 이 도구는 원래 shotgun metagenomic read로부터 phylogenetic distribution을 알아보기 위하여 개발된 것이지만, 단일 유전체 어셈블리로부터 universal marker(목록; 원래 40개였으나 실제로 쓰이는 것은 37개)를 찾아낼 수 있으므로 미생물 유전체 조립의 완성도를 평가하는데 쓰이기도 한다. 더욱 좋은 것은 alignment까지 된 상태의 서열이 생성되므로 이를 잘 이용하면 tree를 쉽게 그릴 수 있다. PhyloSift가 metagenome sample로부터 만들어내는 tree와는 다른 것이니 주의가 필요하다.

Bacillus_subtilis_168.fa라는 유전체 파일을 이용하여 PhyloSift를 실행했다고 가정하자(search 및 align mode). 그러면 PS_temp/Bacillus_subtilis_168.fa/ 아래에 alignDir 및 blastDir가 생기고, 그 하위에 각 마커에 대한 파일이 쌓인다. marker_summary.txt는 다음과 같이 생겼다.


각 유전체 서열마다 별도로 작성된 이 파일을 병합하여 정리하면 모든 마커가 전부 확인되었는지의 여부를 쉽게 알 수 있을 것이다. 오늘의 고행은 여기서부터 시작되었다. Perl을 사용하면 어떻게 해서든 결과를 얻을 수 있었겠지만, 왠지 R을 쓰고 싶었다. R을 이용하여 코드를 짜 놓으면 재사용성이 높을 것 같았기 때문이었다.

marker_summary.text file의 정리


각 유전체 서열에 대해서 별도의 디렉토리에 나뉜 marker_summary.txt 파일을 한 곳으로 모으되 균주명이 파일의 제목이 되게 바꾸었다. Shell script를 써서 구현하였다.
FILES=`find $1 -name marker_summary.txt -type f | grep blastDir`
for f in $FILES
do
        FILE=$(cut -d'/' -f2 <<<$f)
        FILE=${FILE%.fasta}
#        cp $f ${OUTDIR}/${FILE}
        grep DNGNGWU $f > ${OUTDIR}/${FILE}
done
find로 찾아낸 파일명(경로 포함)은 다음과 같다. 빨강색 문자열만을 뽑아내는 것이 포인트이다. cut 명령을 사용하여 슬래쉬(/)를 기준으로 분리한 두번째 문자열을 취한 다음 뒷부분의 .fasta를 제거해야 한다.

PS_temp/Paenibacillus_sp._UNCCL52_GCF_000686825.1.fasta/blastDir/marker_summary.txt

오늘의 시도에서는 파일 내부를 grep으로 뒤져서 DNGNGWU...로 시작하는 표준 마커에 대한 결과만을 모았다. match가 없는 마커의 경우 0이 표시되는 것이 아니라 아예 summary file에 존재하지 않는다. 이것이 나중에 R에서 병합 작업을 하는 것을 약간 어렵게 하였다. 만약 모든 마커에 대한 결과가 다 있었다면, 마커의 순서가 동일한지만 확인한 뒤에 cbind()를 하는 것으로 쉽게 끝났을 것이다.

[R] for loop를 이용한 텍스트 파일의 일괄 입력 및 outer join


이러한 용도의 R 패키지가 이미 개발된 것이 있을지도 모르지만 되도록 R의 기본 기능을 충실하에 이용하여 구현하고자 하였다. 먼저 정리된 파일이 모여있는 디렉토리로 이동하여 R을 실행하였다. 다른 곳에서 R을 실행한 뒤 setwd() 함수를 실행하여 파일 위치를 지정하여도 좋다. 파일의 일괄 입력에서는 Import multiple files to R의 예제를 거의 그대로 따랐다.
list.filenames = list.files()
# 특정 확장자를 지닌 파일만 읽어들이려면 list.files(pattern="*.txt")
# create an empty list
list.data=list()
length(list.filenames)
# create a loop to read in your data
for (i in 1:length(list.filenames))
{
# 이중 대괄호 안에 인덱스를 넣어야 데이터프레임을 부르는 것이 된다.
list.data[[i]] = read.table(list.filenames[i],sep=",",header=F)
colnames(list.data[[i]]) = c("markers","numbers")
}
# 다음의 두 명령은 결과가 약간 다르다.
# 궁금하면 class() 함수를 써 보라.
list.data[1]
list.data[[1]]
# add the names of your data to the list
names(list.data) = list.filenames
# name으로 사용된 파일명에서 확장자를 제거하려면 방법을 따로 알아보아라.
다음으로는 데이터 프레임을 join해야 한다. 기준이 되는 컬럼은 markers이다. outer join을 하였으므로 값이 없는 경우에는 NA가 채워지고, 이는 나중에 0으로 채우면 된다. R에서의 join에 대한 개념은 여기를 참고하였다. merge 함수는 두 개의 데이터프레임을 대상으로 한다. 만약 인덱스로 접근 가능한 데이터프레임이 있는데 총 50개가 있다면 이를 어떻게 합치겠는가? 1번과 2번을 merge하여 임시 데이터프레임을 거쳐서 2번에 저장한다(한꺼번에 저장하는 것이 더 간단할지도 모른다). 그 다음 인덱스를 1 증기시키고 2번과 3번을 merge하여 3번에 저장한다. 이를 인덱스=(전체 데이터프레임 수 - 1)이 될 때까지 for loop를 돌린 다음 종료하면 된다.

# outer join
for (i in 1:(length(list.filenames)-1))
{
df = merge(x=list.data[[i]],y=list.data[[i+1]],by="markers",all=TRUE)
list.data[[i+1]] = df
}
df = list.data[[length(list.filenames)]]
df[is.na(df)] = 0
rownames(df) = df[,1]
df = df[,-1]
colnames(df) = list.filenames
# 최종 확인
dim(df)
View(df)

View(df)의 결과 화면(일부).
첫번째 컬럼(markers)를 row name으로 전환하여 새로운 데이터프레임 df.2에 저장하자.
> df.2 = data.frame(df[,-1], row.names=df[,1])
> dim(df.2)  # 컬럼 수가 하나 줄어들었다.

결과 점검하기


단 하나라도 마커가 발견되지 않은 유전체는 어느 것일까? 또 어떤 마커가 발견되지 않았을까? 마커의 총 수가 37개라고 해서 컬럼의 합을 가지고 판단의 기준을 삼을 수는 없다. 왜냐하면 주어진 마커가 2회 발견되는 경우도 있을 수 있기 때문이다. apply()함수를 사용하면 이를 매우 쉽게 찾아낼 수 있다. 

각 row에 대해서 어느 하나라도 0이 존재하는지를 알아보자. 빨강색으로 표시한 마커가 TRUE를 나타내고 있다. 바로 저 row name만을 반환할 수 없을까?


> apply(df.2 == 0, 1, any) # row에 대하여
> apply(df.2 == 0, 2, any) # column에 대하여
위 명령어를 입력한 다음 눈으로 찾을 수는 없는 노릇이다. 정답은 다음과 같다.
> rownames(df.2)[apply(df.2 == 0, 1, any)]
[1] "DNGNGWU00040"
> colnames(df.2)[apply(df.2 == 0, 2, any)]
[1] "Paenibacillus_polymyxa_TD94_GCF_000520775.1"
오늘 하루가 다 지나갔다! 데이터프레임에서 특정 조건을 만족하는 서브셋을 추출하는 것도 중요하지만, 그 조건에 만족하는 column 혹은 row의 이름을 알아내는 것도 중요하다.

2018년 1월 30일 화요일

또 진공관 앰프?

<성장 없는 번영>이라는 책을 다 읽고 나니 '소비'라는 행위를 뒤돌아보게 되었다. 우리 주위에는 '제발 나를 쇼핑해 달라고' 외치는 갖은 유혹이 얼마나 많은가? 이제는 필요에 의해서 구입을 하는 것이 아니라 이것을 가짐으로 인해서 내 삶이 과시적으로 업그레이드된다는 욕구를 채우기 위하여 구입을 한다. 그 과정 중에 생태계는 자꾸 무너진다. 별도의 독서 기록에서 다루겠지만, 모든 지구 상의 나라가 현재의 미국인처럼 소비할 수 있는 날은 오지 않을 것이다. 이에 대한 대안을 찾자는 것이 이 책의 주제이다.

그럼에도 불구하고 마우스 포인터는 이미 온라인 쇼핑 사이트를 뒤적거리고 있다. '무엇을 살까?'는 고통스런 고민을 하면서 계속 서치를 하는데 들어가는 비용은 어쩌면 일단 무엇인가를 지르는 비용보다 더 클지도 모른다. 그러니 너무 오래 고민을 반복하지 말고 일단 구매를 하자. 이러한 경제적인 자기 합리화를 해 가면서 뭔가를 샀다고 치자.

또 얼마간의 시간이 지나면 커피 찌꺼기에서 곰팡이가 피어나듯(요즘 집에서 늘 겪는 문제) 새로운 욕구는 또 생겨날 것이다.

그래... 웹 서칭이 무슨 큰 잘못이랴. 근무 중에 지나치게 다른 사이트를 들락거리는 것은 물론 옳지 않다... 일단 조사만 해 두자. 중국제 저가 앰프(자작용 키트를 포함하여)를 둘러보면 어떤 유행과 같은 것이 보인다. 일년 전에 잔뜩 쏟아져나온 물건은 어느덧 사라지고 또 새로운 트렌드의 물건이 목록을 차지한다. Class D 앰프가 그랬고, JLH 1969년 class A 앰프가 그러했다.

진공관만으로 이루어진 채널당 3 W 남짓의 그저 그런 앰프는 내가 보유한 저능률 스피커 시스템을 만족스럽게 울리기 어려울 것이다. 그렇다고 하여 출력이 약간 큰 저가의 앰프를 고르면 집에서 2014년 이래 아주 잘 쓰고 있는 12DT8 + 14GW8(=PCL86) 앰프(링크)보다 결코 나을 수가 없을 것이다. 그래서 진공관 프리앰프 + IC를 이용한 이용한 hybrid amplifier를 찾아보았다. 하이브리드 앰프라 하면 요즘 Nobsound의 MS-10D가 단연 인기이다. '진공관은 단지 장식용이다! 아니다, 진공관을 빼면 소리가 안난다! 트랜스 커버를 벗기면 아무것도 없다!' 등 여러 논란에 휘말린 앰프인데 일단 모양새는 그럴싸하다. 게다가 아날로그식 레벨 메터까지 있으니 보는 재미는 좋을 것이다. 처남이 얼마전에 주문을 했다는데 배송이 완료되었는지 궁금하다.



아래에 소개한 앰프 키트는 전부 6J1 진공관(교체관 정보)과 LM1876T를 사용한 것이다. 위의 것은 헤드폰 단자도 갖추고 있다.

인터넷에서 '무단으로' 그림을 퍼 온 뒤에 글씨를 달았다. 그림의 URL을 연결하는 방식으로 블로그에 소개하고 싶었지만(이것도 무단사용에 해당할까?) ebay 등의 상품 주소는 판매기간이 종료되면 더 이상 유효하지 않은 것 같다. 굵은 글씨로 표시한 키워드를 이용하여 검색하면 어떻게든 찾을 수 있다.

아아, 집에도 앰프가 세 개, 사무실에도 세 개나 있는데 뭘 또 만들고 싶어서 이런단 말인가?

2018년 1월 27일 토요일

독서 기록 - <나를 믿어주는 한 사람의 힘> 외 네 권

이번에는 대출 기한을 일주일 연장했음에도 불구하고 대출한 책을 다 읽지 못하였다. <처음 읽는 일본사(전국역사교사모음 지음)>, <불평등의 역사(발터 샤이델 저|조미현 역)>, 그리고 <스트레스는 어떻게 삶을 이롭게 하는가(우르스 빌만 저|장혜경 역)>는 다음 기회에 꼭 읽도록 한다.

사진 퀄리티가 영 좋지 못하다. 거실 바닥에 놓고 찍으면 조명이 늘 문제다

나를 믿어주는 한 사람의 힘

  • 부제: 문화치유전문가 박상미의 인생특강
  • 박상미 지음(더공감 마음학교 링크)
나를 믿고 지지해주는 한 사람의 힘으로 인하여 풍성한 삶을 이어나가는 10 인을 심층 인터뷰하고 쓴 책. '시련을 극복한~', '성공한~' 이라는 수식어를 붙이는 것은 적당하지 않다. 이 척박한 세상에 향기를 드리우며 다른 사람에게 좋은 영향력을 미치는 풍성한 삶을 누리는 사람이라고 하면 딱 좋을 것이다. 참여한 사람은 김혜자, 박동규, 이병복, 표재순, 신경림, 인순이, 황현산, 조벽, 김현영, 그리고 섀넌 두나 화이트. 맨 마지막은 저자 박상미가 자신을 인터뷰하는 형식으로 마무리하였다. 문학평론가 황현산이 현명한 어른이 되는 길에 대하여 말한 것을 인용해 보았다.
나이가 들수록 듣는 연습을 해야 하고, 토론을 해야 합니다... 배우기를 멈추지 말고 참신하게 생각하도록 노력해야 합니다. 가장 중요한 게 책을 읽는 것입니다... 나보다 어린 애들이 쓴 글이라고 생각하는 순간 문제가 시작됩니다... 나이의 향기를 풍길 수 없는 사람들이 나이의 권력을 탐하는 것 같다(박상미) 
교수법 전문가 조벽 교수는 이렇게 말했다
(부부가 이혼에 이르는 가장 큰 문제는) 바로 '말'입니다... 멀어지는 말이 상대의 마음을 아프게 해서 마음 문을 아예 닫아버리게 하죠... 그 말에 네 가지 독이 존재해요. '비난, 경멸, 방어, 담 쌓기'라는 독이에요... 이 독을 마음에 품는 순간 얼굴에 다 나타난대요.

어떻게 바꿀 것인가

  • 부제: 비정상 정치의 정상화를 위한 첫 질문
  • 강원택(서울대 정치외교학부 교수) 지음
긴 고난의 터널을 뚫고 대한민국 민중은 드디어 5년 단임 대통령제를 핵심으로 하는 1987년 체제를 탄생시켰다. 그러나 이제는 강력한 리더십을 지닌 슈퍼맨 대통령에게 강력한 힘을 위임하는 것으로 더 이상 국가의 변혁이 어려움을 설파하고, 제도적 대안으로서 내각제를 주장한 책이다,

미래중독자(The Invention of Tomorrow)

  • 부제: 오늘을 버리고 내일만 사는 별종, 사피엔스
  • 다니엘 S. 밀로 지음
  • 양영란 옮김
"내일 보자!" - 인류가 떠올린 가장 혁명적인 문장.
인류는 '과잉'의 시대에 살고 있다. 저자 역시 인간 사회에 만연한 과잉에 대한 '과잉된 강박'을 가지고 있다고 한다. 정속 주행은 퇴보로 여기고 '가속도'를 추구하는 것이 인간의 본성이 아닐까? 왜 5만 8천년 전 호모 사피엔스는 별안간 아프리카를 떠났을까? 이것은 바로 인간이 발명한 '내일' 때문이라는 것이다. 유발 하라리가 주장했듯이 추상적 개념·상상력이 인류의 협동을 이끌어내어 현재의 문명을 만들어냈다는 것과도 일맥상통한다. 저자의 말에 의하면 이 '빌어먹고도' 찬란한 내일에 중독된 것이 인류이다. 내일을 위해 기꺼이 오늘을 포기하는 유일한 생명체가 인간이다. 기대는 곧 불안·와 동전의 양면과 같은 관계가 아닐까?

현대미술은 처음인데요

  • 부제: 큐레이터가 들려주는 친절한 미술 이야기
  • 안휘경, 제시카 체라시 지음
  • 조경실 지음
예술가의 똥(Artist's Shit; Merda d'artista; 피에로 만초니, 1961)

어떠한 작품이 현대미술인지 아닌지를 구분하는 기준은 단순한 시간이 아니라 작품의 기준이 무엇이냐에 따라 달려 있다. 현재라는 순간을 해석하는 작업은 좀처롬 쉽지 않고, 현대라는 사회를 이해하는 일 역시 혁신적인 기술과 새로운 접근방식을 요구한다(30 쪽). 

화장실에서 흔히 볼 수 있는 기성품 변기를 가져다가 작가의 사인만을 추가한 마르셀 뒤샹의 샘('Fountain', 위키피디아)을 현대미술의 시작으로 보는 견해도 있다. 하지만 이는 '세계 3대 기타리스트'라는 식으로 지나친 단순화라고 생각한다. 현대미술의 이단아 마르셀 뒤샹의 "샘"이야기(링크)를 읽어볼 것을 권한다.

작품은 사라지고 알프레드 스티글리츠가 찍은 사진과 복제품만 남았다.

때로는 어떤 작품은 미적 가치보다 아이디어, 정치적 관심, 감정의 자극으로 주목을 받을 수도 있다(31쪽).
작가 혼자서 공들여 만들여야만 작품이 되는 것이 아니다. 현대 미술은 이미 여러 스태프에 의해 구현되는 것이 일반적이며, 심지어 개념만으로도 작품이 되며, 퍼포먼스 아트도 이미 흔하다. 다음에 현대미술관을 방문하게 되면 좀 더 열린 마음으로 편안하게 감상을 할 수 있으리라 기대해 본다. 현대미술은 항상 변화하고 있는 현대를 보여주는 것이다. 중요한 것은 작품이 아니라 작가이다.

99%를 위한 경제학

  • 부제: 낮은 곳을 향하는 주류 경제학 이야기
  • 저자: 김재수(미국 인디애나퍼듀대학 경제학과 교수) 허핑턴포스트의 김재수 블로그 글목록 링크
보이지 않는 손, 비교우위, 기회비용, 비용-편익 분석, 경제적 인센티브에 반응하여 행동하는 인간... 우리가 알고 있는 주류 경제학은 단지 상위 1%를 위한 것이 아니었을까? 시장은 '기업'과 동의어가 아니다. 시장이 올바르게 작동하려면 모든 경제적 판단을 위한 정보가 전부 투명하게 공개된 상태에서 공정한 경쟁이 이루어져야 한다. 
"우리는 인센티브를 믿사오니, 공공부문과 정부규제에 고난을 받으사 복지 예산에 못박혀 죽으시고, 민영화와 규제완화를 통해 다시 살아나시며, 산 기업과 죽은 기업을 심판하러 오시리라. 성과급을 믿사오며 부자감세와 기업 프렌들리 정책의 효과가 서로 교통하는 것과 영원히 경제성장이 이루어지는 것을 믿사옵나이다. 아멘."(129쪽)
자유시장경제에 대한 옹호·세계화의 파도에 휩쓸려 경제적 약자인 을('乙')의 위치는 날이 갈수록 열악해져만 간다. 효율성을 추구하기 위해 어쩔 수 없다는 논리와 함께 이들은 계속 나락으로 떨어져만 간다. 뭔가 잘못되었다고, 권력과 결탁한 거대 기업의 편이 되어서는 안된다고 주장하고 싶지만, 아직도 주변에는 "박정희 대통령 덕분에 우리가 이정도 먹고 사는거야"라고 소리치는 사람들이 많다.
선택이 야기하는 기회비용을 본다는 것은 경제학도가 반드시 지녀야 할 반골 정신을 의미합니다. 권력과 권위, 또는 관습에 의해 당연하게 여겨지는 것들에게도 잃고 있는 것을 찾아내야 합니다.(11-12쪽)
이번에 읽은 다섯 권의 책 중에서 가장 울림이 큰 책이었다. 

소화전함이 수령한 택배 배달 물건

집에 사람이 없을 때 아주 가끔 소화전함에 물건을 넣어두었다는 문자 메시지를 받을 때가 있다. 바쁜 택배 기사들의 입장을 생각하면 이해하지 못할 일은 아니지만 물건이 없어진 경우 책임 소재의 문제가 따른다. 만약 나쁜 마음을 먹은 사람이 아파트에 들어와서 고층부터 소화전함을 훑으면서 한번씩 다 열어본다면 수십 대 일의 가능성으로 주인을 기다리는 물건을 훔쳐갈 수도 있는 것 아니겠는가? 수령 예정자가 소화전함에 넣어 두는 것을 동의했다고 해서 배송 기사에게 아무런 책임이 없을까?

배송기사: OO택배입니다. OOO님 지금 댁에 안계신가요?
수령인: 네, 지금 집에 없으니 소화전함에 넣어주세요.
배송기사: 그건 규정 상 안됩니다. 부재중이시면 경비실에 맡기거나 내일 다시 오겠습니다.
수령인: 에이, 뭐 별 일 있겠어요. 없어지면 제가 책임질테니 그냥 소화전함에 넣어주세요.

만약 이런 대화가 오갔다면 배송기사의 책임이 없을지도 모르겠다. 법을 다루는 사람들의 해석은 어떨지 모르겠지만 말이다.

오늘 아침, 오후 5~7시 사이에 주문한 케이블이 배송될 예정이라는 메시지를 받았다. 잠시 외출하였다가 집에 돌아온 것은 3시 정도. 침대에서 졸다가 5시쯤 문자 메시지를 받았는데, "소화전"께서 인수를 했다는 내용이었다. 다른 전화 연락은 일절 받은 것이 없었고 심지어 초인종도 울리지 않았다.


우리 아파트는 지은지 오래되어서 인터폰이 고장난 곳이 대다수이다. 인터폰을 걸어보다가 받지 않았다면 최소한 집 전화나 휴대폰으로 연락을 하면 되고, 집까지 와서 문 옆의 소화전에 물건을 넣을 시간이 있었다면 차라리 초인종을 한 번만이라도 눌러보는 것이 더욱 자연스럽지 않겠는가.

인터넷으로 찾아보면 이런 경우가 워낙 많아서 특별히 불만을 표시할만한 일도 아닌 것 같고, 그냥 문 앞에 방치하고 간 것에 비하면 훨씬 나은 상황인 것은 분명하다. 그렇다 해도 약간은 아쉬움이 남는다. 아래 사진은 오늘 받은 물건이다. 사무실에서 USB DAC <-> (진공관 프리앰프) <-> TDA7265 앰프 사이를 연결하기 위한 15 cm짜리 짧은 케이블이다.


낮 시간에는 아내가 필요한 홈패션 부자재를 사러 시내 재래시장에 나갔었다. 시장 안에 있는 분식집에서 호떡을 주문하고 만들어지기를 기다리고 있었는데, 주인 아주머니께서 허리춤으로 와플을 담은 바구니를 건드려서 이를 바닥에 떨어뜨렸다. 난 떨어뜨렸으니 이건 못팔겠다고 할 줄로만 알았다. 그렇게 말하고 나서 우리가 떠난 뒤 이를 모르는 다음 손님에게 판매한다고 해도 어쩔 도리는 없다고 생각했다. 그러나 아주머니께서는 아주 태연하게 와플을 다시 바구니에 담았고, 새로 구운 와플과 함께 진열대에 올려놓는 것 아닌가.

글쎄, 이 광경을 전부 목도하였으니 투철한 소비자 정신에 입각해서 뭐라고 항의했어야 할까. 가장 소극적인 항의는 다음부터 이 분식점에 가지 않는 것이겠지만, 난 특별히 뭐라 하지는 않고 묵묵히 호떡을 들고 그곳을 나왔다.

약간의 아쉬움이 묻어나는 하루였다.

2018년 1월 26일 금요일

NCBI에서 대량의 미생물 유전체 정보 다운로드하는 요령 - 업데이트

몇 번에 걸쳐서 유전체 정보의 일괄 다운로드(전체 혹은 선별된 것) 방법을 블로그에 작성한 적이 있다. 항상 일정한 위치에 업데이트된 상태로 존재하는 assembly summary 파일을 받아서 선택한 유전체의 FTP 주소 base를 얻어낸 다음 이를 wget이나 curl로 내려받는 것을 기본으로 하였다. 좀 더 편리한 방법은 없을까? 검색을 해 보니 ncbi-genome-downlaod라는 파이썬 패키지가 보인다. 이를 오늘의 블로그 포스트 뒷부분에 소개하기로 하고 우선은 NCBI Genome Download (FAQ)를 오랜만에 읽어보았다.

2번 항목(대용량 데이터 셋의 다운로드에 가장 좋은 프로토콜은 무엇인가?)를 살펴보니 rsync를 최우선적으로 권고한다고 하였다.  그 다음은 HTTPS이고, FTP는 가장 나중이다. 솔직히 말해서 wget과 curl의 차이도 잘 모르는 부끄러운 연구자라서 이 정보는 매우 새롭게 느껴졌다. [curl 대 wget] 어느 프로그램이 더 좋을까?를 읽어보는 것도 좋을 것이다.

RefSeq의 complete bacterial genome을 다운로드하는 방법은 15번 항목에서 설명하였다. 오늘 날짜의 bacteria assembly summary file(링크) 무려 31 메가바이트가 넘으며 라인 수만해도 104,704이다! FAQ 페이지에서는 12번째 컬럼에서 최신 어셈블리 여부("latest")를 확인할 수 있다 하였는데, 실제 파일을 열어보면 모든 자료가 latest이다.

ncbi-genome-download(NCBI Genome Downloading Scripts)는 PyPIGitHub에 전부 존재한다. 이 스크립트의 아이디어는 Mick Watson의 Kraken downloader script에서 아이디어를 "훔쳤다"고 솔직하게 고백하였다. 몇 가지 사용례를 살펴보자.
$ ncbi-genome-download bacteria
$ ncbi-genome-download bacteria,viral
$ ncbi-genome-download bacteria --parallel 4
$ ncbi-genome-download --section genbank fungi
대단히 단순명료하다. 이렇게 가려운 곳을 긁어주는 스크립트가 도처에 널려있으니 얼마나 고마운지 모르겠다. 남이 만들어 놓은 도구를 갖다 쓰기만 할 것이 아니라 나도 뭔가 사회에 기여를 해야 하는데 늘 부족하기만 하다. 

2018년 1월 23일 화요일

Adaptive mutations in bacteria

제목을 써 놓고 보니 덜컥 겁이 난다. 내가 과연 이 어려운 제목에 합당한 블로그 포스팅을 성공적으로 마칠 수 있을까? 나 자신이 과연 이 개념을 제대로 이해하고나 있을까? 결국은 '진화'라는 주제로 접근해 가야 하는데, 모든 자연과학의 역사에서 가장 지대한 영향을 미쳤음에도 불구하고 아직까지도 잘못 이해되고 있는 진화라는 개념의 지지자로서 내가 과연 제 역할을 할 수 있을까?

돌연변이란 DNA의 염기(서열)이 여러가지 요인에 의하여 원본(즉 부모)과 달라지는 것을 의미한다. 따라서 후손으로 전파 가능하여야 하고, 이것이 반드시 표현형으로 나타남을 의미하지는 않는다. 돌연변이는 세포 혹은 개체 수준에서 일어나지만, 진화는 집단에 대하여 적용되는 개념이다. 돌연변이는 진화의 가장 중요한 원동력이지만 유전적 부동(genetic drift), 선택(positive or negative)을 거쳐서 집단 안에서의 특정 유전자형을 지닌 개체의 빈도가 변화했을때 비로소 진화가 일어났다고 이야기할 수 있을 것이다.

진화를 설명하는 최초의 이론은 라마르크의 용불용설(用不用說, Lamarckism, Lamarckian inheritance, theory of use and disuse)이다. 획득형질은 유전되지 않는다는 것이 밝혀지면서 현재 라마르크주의는 더 이상 받아들여지지 않는다. 그러나 요즘의 후성유전학 연구에 의하면 어미의 경험이 자손으로 전해지는 흥미로운 결과가 종종 발표되는 것 같다.

진화를 공부하고 싶다면

아래의 링크는 앞으로 계속 업데이트할 생각이다. 이 글에서는 주로 박테리아의 돌연변이와 진화에 한정하여 논할 것이다.

적응진화(adaptive mutation)이란 무엇인가?

돌연변이는 무작위적으로 일어나고, 이 중에서 환경에 의해 선택되는 것만이 살아남는다는 것이 현대 진화학의 핵심 기념일 것이다('Mutation precedes selection'). 그런데 유독 박테리아는 아무리 열악한 환경에 가져다 놓아도 살아남는 돌연변이체가 만들어진다. 그래서 미생물처럼 단순한 생명체는 환경에 맞는 돌연변이를 스스로 만든다는 믿음이 널리 퍼져 있었다. 이를 부정한 유명한 실험이 바로 1943년에 발표된 루리아와 델브뤽의 fluctuation test이다(위키피디아). 이 실험의 결론은 선택압(이 경우에는 phage T1의 감염)이 존재하기 이전에 이미 내성 돌연변이체가 존재한다는 것이었다. 그 내성 돌연변이는 무작위적으로 생긴 것으로서 미생물 세포가 설계하거나 선택한 것은 전혀 아니라는 뜻이다.

그럼에도 불구하고 미생물의 adaptive mutation, 즉 세포가 분열을 하지 못할 극한 상황에서도 이에 맞추어어진 돌연변이가 생겨난다는 가설을 입증하는(것처럼 보이는) 결과가 이따금 발표되었고, 1988년 John Cairns가 이 문제를 학계로 가지고 올라오면서 본격적인 논쟁이 시작되었다(The origin of mutants. Nature 1988). Cairns는 세포가 환경에서 살아남을 수 있는 유용한 돌연변이를 골라낸다고 주장하였다. 항암제에 내성을 지니는 변이 암세포가 생겨나는 것도 adaptive mutation 현상 중의 하나로 보고 있다.

Adaptive mutation을 현대적인 용어로 정의한다면 (1) 선택 과정에 놓여서 분열을 하지 못하는 미생물 집단으로부터 새로운 돌연변이 개체가 계속 만들어져서 성장하는 현상 또는 (2) nonlethal selection 조건 하에서 선택압을 낮출 수 있는 변이 개체가 생거나는 과정(선별되지 못하는 돌연변이 개체가 생기는지의 여부는 관계없이)이라고 말할 수 있다. 좀 더 완곡하게 표현한다면 stationary-phase mutagenesis라고도 부른다. Fluctuation test에서는 가해진 선택압이 정상 세포에게는 치명적인 것이라서 이들을 전부 죽여버리므로, 선택압이 존재하는 조건에서 변이체가 생겨나는 것을 관찰하는 것 자체가 차단되었다. 따라서 nonlethal selection이라는 조건이 중요한 것이다.

Adaptive mutation이 실제로 존재하는지를 완벽하게 증명한 사례는 아직 없는 것 같다(내가 문헌 조사를 철저하게 하지 못해서 빚어진 오해일지도 모른다). 대신 세포분열이 불가능한 조건에서 돌연변이체의 발생 빈도가 높아지는 몇 가지 메커니즘이 밝혀졌다. 이것조차 미생물이 진화를 통해서 선택한 생존 전략이라면 결국 adaptive mutation은 실재하는 것이 아니냐고 부르짖을 수도 있겠다. Patricia L. Foster는 2000년도 논문을 통해서 대장균 FC40 스트레인에서 발견되는 메카니즘을 다음의 세가지로 정리하였다(Cold Spring Harb Symp Quant Biol 65:21 PubMed; Bioessay 22:1067 PubMed).

Recombination-induced DNA replication

The placement of genes on a conjugal plasmid

A transient mutator state

이 연구 내용은 추후에 Roth가 더욱 상세하게 리뷰하였다(Origin of mutations under selection: the adaptive mutation controversy. Ann Rev Microbiol 2006 PubMed). 상세한 내용은 문헌을 참고하면 된다.

대장균 FC40은 염색체의 lac operon에 결실이 있는 반면 이를 F episome에 갖고 있는데, lacZ +1 mutation이 있어서 lactose minimal 배지에서는 자라지 못한다(Lac- phenotype). Nonselective condition에서는 1 per 109 cells per generation 정도의 빈도로 Lac+ revertant cell이 발생한다. 그런데 Lactose minimal medium에서는 1 per 109 cells per hour로 수일 동안 지속해서 발생한다. 물론 이 revertant는 이미 만들어진 Lac+ cell이 자체 분열을 통해서 늘어난 효과는 보정한 것으로 생각한다.

그림 출처: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2929355/

신개념 - Retromutagenesis

선택압이 주어져서 정상 세포는 분열을 하지 못하는 상황을 가정해 보자. DNA의 한쪽 가닥에 발생한 돌연변이가 안정적으로 후대로 전파되려면 어떻게 해서든 최소한의 cell growth가 일어나야 한다. Retromutagenesis는 이를 설명하는 멋진 메커니즘이다(유일한 제안은 아니다). NTG 처리(adenosine -> hypoxanthine) 혹은 산화(guanosine -> 8-oxoguanosine)로 인하여 손상된 유전자로부터 변이 단백질이 만들어져서 변이 유전자가 daughter chromosome으로 복제될 정도의 최소한의 growth가 일어난다는 것이다. 이 현상은 1994년 Bridges가 처음 보고하였으며(Starvation-associated mutation in Escherichia coli: a spontaneous lesion hyporthesis for "directed" mutation. Mutat Res 1994, PubMed), Morreall 등이 보다 정교한 실험을 실시하였다(Evidence for retromutagenesis as a mechanism for adaptive mutation in Escherichia coli. PLoS Genetis 2005, PubMed). Retromutagenesis에서는 변이 단백질의 발현이 선행되어야 하며, transcribed strand에 일어나는 돌연변이가 결과적으로 더 많이 남게 됨이 당연하다.

Transcription bubble에서 노출되는 가닥은 non-transcribed strand이다. 여기에 존재하는 C가 탈아미노화를 거쳐서(ds DNA에 비하여 140배 높다) T로 돌연변이가 된다는 것은 이미 잘 알려져 있으며(Transcription-induced mutations: increase in C to T mutations in the nontranscribed strand during transcription in Escherichia coli. Proc Natl Acad Sci USA 1996, PubMed), tretromutagenesis와는 다른 논지의 이야기이다.

Moreall 등의 실험을 좀 더 자세하게 알아보자. 이들은 LacZ(Am) 돌연변이 세포주를 이용하였다. Amber mutation은 coding (non-transcribed) strand(NTS)에서는 TAG, transcribed strand(TS)에서는 ATG이다. 아질산(nitrous acid, HNO2)은 A에 작용하여 hypoxanthine을 만드는데, 이는 C와 결합을 한다. 따라서 한 라운드의 DNA 복제를 거치면 A:T -> G:C의 transition mutation이 일어난다. 따라서 NTS와 TS의 어느 가닥이 아질산에 의해 수식되는가에 따라서 초래되는 돌연변이가 달라진다. 이것은 DNA sequencing으로 금방 알 수 있다.  즉 NTS에 변이가 일어나면 TGG가 생기는 반면 TS에 변이가 일어나면 CAG가 생긴다. 저자들은 이 LacZ(Am) 돌연변이 대장균을 포도당이 첨가된 LB에서 포화상태까지 키운 다음 세척하여 starvation 상태로 만든 뒤 아질산을 첨가하였다. 그 다음 일부는 락토스 최소 배지에 직접 도말하고, 또 일부는 LB에서 잠시 키운 뒤 락토스 최소 배지에 도말하였다. 각 평판 배지에서 약 48시간 가량 키운 후 생성되는 Lac+ revertant의 lacZ 유전자를 시퀀싱하여 원래 있었던 amber 돌연변이가 CAG와 TGG 중 어느 것으로 더 많이 변했는지를 측정하였다.

왜 첫번째 단계에서 LB에 포도당을 첨가하였을까? 저자들은 사전 단계에서는 보통의 LB 배지를 사용하였다. 아질산을 처리하였을 때 Lac+ revertant의 발생 비율은 20배 상승하였다. 이 중에서 30개의 Lac+ revertant 콜로니를 채취하여 염기서열을 해독하였더니 전부 NTS에서만 변이가 발생한 것이었다. 원래 만들고자 했던 실험 조건은 양 가닥에 균등하게 변이가 발생하도록 하는 것이었다. 이에 대해서는 Davis의 연구결과(Transcriptional bias: a non-Lamarckian mechanism for substrate-induced mutations. Proc Natl Acad Sci USA 1989, PubMed)로 설명이 가능하다. Transcription bubble에서 single strand 형태로 노출된 NTS는 DNA에 손상을 주는 물질에 좀 더 민감하다는 것이다. 이론적으로는 rich medium에서 키웠었으니 lac operon이 발현되지 않았어야 하지만, 실제 세계에서는 그렇지 못했다. 따라서 강한 catabolite repression이 유지되도록 일부러 포도당을 넣어주게 된 것이다. 이렇게 하였더나 NTS에서 revertant가 더 많이 발생하는 편향이 사라졌다.

확정된 실험 계획에 따라 아질산을 가해서 돌연변이를 유발한 뒤 rich medium에 잠시 배양했다가 lactose selective medium으로 옮겨서 생성된 Lac+ revertant에서는 CAG와 TGG가 거의 동일한 수준으로 나타났다. lacZ 유전자가 발현될 기회가 없었으므로 양 가닥에 발생한 손상이 배양을 거치면서 모두 공평하게 염기의 변이로 정착된 것이다. 그런데 돌연변이 유발 직후 lactose selective medium으로 옮긴 경우에는 어떠했는가? CAG가 압도적으로 많았다. 다시 말하자면 TS에 더 많은 변이가 발생한 것이다. 이를 그림으로 설명하면 다음과 같다.

http://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1005477
아직 이 논문을 discussion 끝부분까지 철저하게 읽은 것은 아니라서 transcription-associated mutagenesis(transcriptional mutagenesis와는 구별해야 함)와는 어떻게 다른지, 실험 결과의 다른 해석이 가능하지는 않은지 등은 이 포스팅에서 충분히 다루지 못하였다. 결론으로는 환경이 돌연변이를 맞춤 생산하는 것 같지는 않다는 것이다. 2015년 이 논문의 발표 당시 Science Daily에 이를 소개하는 기사가 실렸었다.

Adaptive mutation mechanism may explain some forms of antibiotic resistance.
Retromutagenesis: Mutation occur in RNA first (2015년 8월 25일 링크)

그런데 이 기사에서는 돌연변이가 RNA에서 먼저 일어난다고 해석을 붙였다. DNA에 일어난 lesion(아질산에 의해 adenosine이 hypoxanthine으로 변한 것)을 주형으로 하여 전사가 일어날 때 RNA에 U 대신 C가 들어간 현상을 돌연변이라고 표현한 것이다. Discussion 둘째줄을 인용해 보자.
Retromutagenesis requires that RNA polymerases bypass lesions in DNA and incorporate mutations analogous to those caused DNA polymerase bypass.
Hypoxanthine은 원래 C와 염기쌍을 이루는 것으로 배우지 않았던가(링크)? RNA polymerase가 template의 hypoxanthine에 대응하여 C를 넣는 것을 왜 bypass라고 표현하는지 잘 모르겠다.

이 PLoS Genetics 논문은 2018년 1월 23일 현재 4회 인용되었다. 생각만큼 널리 관심을 끄는 주제는 아닌가 싶다.

맺음말


기회가 된다면 이 포스팅은 앞으로도 계속 수정 및 업데이트를 거치게 될 것 같다. 다음에 소개할 논문은 Generation of mutation hotspots in ageig bacterial colonies(Sci Rep 2016, PubMed)이다.

업데이트 이력: 2018년 1월 24일, 1월 25일.

감각은 간사하다

왜냐하면 새롭고 참신한 것에 쉽게 빠져들기 때문이다. 그래서 과거부터 믿고 아껴오던 것을 쉽게 내치는 결과를 낳는다. 그래봐야 '한계효용체감의 법칙'에 따라서 다시 평상시와 다름없는 만족도 수준으로 돌아가게 된다. 그것이 인간의 신경 회로가 돌아가는 원리이다.

진공관 앰프에 잘 어울리는 풀레인지 스피커라는 것에 관심을 가지면서 한동안 수준 이하의 스피커 시스템 제작 또는 개조에 몰두를 했었다. 그러다가 JBL의 2-way speaker FE-M2125(JBL이라는 상표에 너무 가치를 부여할 필요는 없을 것이다)를 얻게 되면서 이 스피커가 들려주는 산뜻한 고음에 귀가 반응하기 시작하였다. 사무실에서 듣는 주력 스피커를 바꿔치기해야 되겠다는 간사한 생각이 드디어 들기 시작한 것이다. 보나마나 며칠이 지나면 이러한 산뜻한 소리에 대한 감동도 점차 줄어들 것이 분명하겠지만.

집에서 CD 전집 - BEST RUSSIA CLASSICS GOLD (100장; 예전 블로그 링크) - 을 들고 출근하여 열심히 리핑을 하고 있다. 광학드라이브가 과열될까봐 조금씩 쉬어가면서 CD를 넣는 중이다. 이 전집의 가격은 요즘 더욱 떨어져서 예스24에서 39,000원에 팔린다.

오른쪽 스피커는 이제 퇴출인가?
JBL 스피커 시스템은 책상 위에 직접 올려놓기에는 약간 버거운 크기라서 배치 방법에 대해서는 좀 더 고민이 필요하다.

자신의 의견을 분명히 말하는 것이 중요한 세상을 살고 있다. 그런데 요즘 심리학과 관련한 책을 조금씩 읽으면서 이런 질문을 갖게 된다.

너는 무엇을 원하느냐?

이것이 아니다. 내 마음은 다음과 같은 배배꼬인 질문을 던진다.

너는 무엇을 원한다고 믿고 싶으냐?

생명체는 유전자의 전달 기계라는 입장이 있다. 어쩌면 인간의 경우 다른 동물보다 지나치게 발달한 '뇌'의 전달 기계인지도 모른다. 마음(욕구, 느낌, 기억, 의지 등등)이 동작하는 원리를 이해하는 것이 결국은 모든 학문이 도달하게 될 종착역인지도 모른다. 음악에 대한 욕구, 남자 특유의 기계에 관한 욕구 등등을 어떻게 충족하는 것이 가장 합리적일까? 여기서 합리적이라 함은 최소 비용으로 최대 효과를 얻는 경제학적 원리만에 충실함을 뜻하는 것은 아니다. 요즘 사회에서는 이를 너무 강조하고 있다.

2018년 1월 22일 월요일

JBL FE-M2125 스피커를 얻다

근처의 사무실에 근무하시던 박사님께서 폐기하려던 2-way 스피커 1조를 얻게 되었다. 원래 댁에서 있던 것을 있던 것을 사무실로 갖고 나와서 몇 년 정도 쓰시던 것이었다. 모델명은 JBL의 FE-M2125이다. 브랜드는 JBL, 제조국은 중국, 수입자는 LG전자... 복잡하다! 공칭 임피던스는 6 ohm, 출력 음압 레벨은 87 dB/W/(1m)이며 우퍼는 6.5인치 급으로 보인다. 우퍼의 엣지도 매우 건강한 상태이다. 사무실에서 사용하는 스피커(이전 블로그 글 링크1, 링크2)와 비교하면 능률이 낮아서 같은 앰프 세팅에서는 더 작은 소리가 난다.



주말에 잠시 나와서 한껏 음량을 높여서 소리를 들어보았다. 한쪽 채널에서 지지직거리는 느낌이 들어서 자세히 귀를 기울이니 고음이 나다 안나다 하는 것이었다. 트위터 유닛이 망가졌나? 만약 트위터의 코일이 끊어졌다면(대단히 흔한 고장), 같은 것으로 교체해야 하는데 이를 구할 수 있을까? 일단은 스피커 내부를 확인해 보기로 하였다. 우퍼를 고정한 4개의 볼트를 육각 렌치로 풀고 플라스틱 커버와 스피커 유닛을 들어냈다. 기대한 바와 같이 크로스오버 회로가 보인다. PC 스피커 수준에서는 보통 전해 캐패시터 하나를 트위터에 직렬로 연결하는 간이 크로스오버 회로를 쓰고는 한다.


내부를 열어보니 트위터가 고장난 것이 아니라 단지 평단자 하나가 빠진 것이었다. 이를 제대로 끼우고 다시 조립을 한 뒤 소리를 들어보았다. 이제 정상적인 소리가 난다. 아래 사진은 사무실에서 테스트용으로 사용한 LM1875 앰프이다.


진공관 스피커와 매칭하기는 어렵지만 내가 보유한 몇 가지 반도체 앰프와 연결해 가면서 즐기기에 매우 적당한 장난감이 될 것 같다. 그러나 오늘의 작은 성공을 가지고 오디오 DIY에 대한 어설픈 자신감에 빠져서는 안될 것이다. 

2018년 1월 21일 일요일

오래된 재단용 가위 녹 제거하기

아내가 이번달부터 지역 평생학습센터에서 주관하는 홈패션 강좌를 듣기 시작하였다. 재봉틀은 센터에 있는 것을 이용하면 되지만 노루발(재봉틀 부품), 재단용 가위, 곡자 등 몇 가지 도구와 부자재가 필요하다. 그중에서 제법 비싼 물건은 재단용 가위이다. 좋은 재단용 가위는 잘만 관리하면 대를 물려서 쓸 수 있다고 한다. 그래서 처가에 있던 가위 두 개를 얻어가지고 왔다. 길이 30 cm과 26 cm짜리 두 개로서 70년대 중반쯤 구입하신 것이라고 들었는데 너무 녹이 많이 슬고 뻑뻑하여 도저히 그대로는 쓸 수가 없었다. 장모님께서는 매우 좋은 물건이니 버리지 말고 잘 쓰라고 하셨다. '잠자리표'라는 상표가 붙은 재단용 가위를 웹에서 찾아보니 1954년에 창업한 우리나라 회사인 HEGA Corporation에서 만든 것이었다. 본사는 충청남도 서천군 장항읍에 있다. 이전 회사명은 동양기업(잠자리표 행순작 재단가위)이라고 한다.

대전 중앙시장 한복거리 근처에 가면 칼이나 가위를 가는 가게가 있을 것이라 기대하고 지퍼 등 부자재를 사러 주말을 이용하여 외출을 하였다. 그런데 가위 가는 장인은 돌아다니면서 일을 하는 분이었다. 원단 상가에 가위를 맡겨 놓고 갈아달라고 부탁해도 되지만 며칠 동안을 기다려야만 한다. 그리고 심하게 녹이 슨 것도 해결이 될까? 동일한 사람인지 알 수는 없지만 가끔 동네 아파트 상가 입구에 작은 트럭을 세워두고 칼이나 가위를 갈아주는 사람을 본 적은 있지만 언제 오는지를 알 수가 없다.

재단 가위는 미용 가위만큼 비싸지는 않다. 잠자리표 가위는 크기에 따라 다르지만 3~4만원 정도이다. 중국제는 더 싸다. 당장 월요일 수업을 위해 18.000 원짜리 저가 가위를 하나 살까, 아니면 이 녹슨 가위를 닦아볼까? 원단 가게에서도 잠자리표 가위라면 잘 손질하여 계속 쓰라고 한다. 결국 녹슨 가위를 닦아보기로 했다. 아니, 갈아냈다고 하는 것이 더 정확하다.

녹슨 금속은 베이킹소다를 물에 풀처럼 개어서 바른 뒤  20분쯤 두었다가 문질러 닦아내면 된다는 인터넷 상의 정보를 보고 어렵지 않게 녹이 제거될 것이라고 생각했다. 그런데 녹도 녹 나름이다. 아무리 베이킹소다를 칫솔로 문질러도 녹은 없어지질 않았다. 다이소에서 판다는 녹 제거제로도 소용이 없을 수준의 두터운 녹이 슨 상태였기 때문이다. 이런 상태에서 내가 할 수 있는 것은 사포와 줄을 동원하는 것이었다. 손가락 끝이 다 부르틀 정도로 사포질을 시작하였다. 장갑을 끼고 사포질을 하는 것이 올바른 것인가? 힘써 사포질을 거의 끝내고 나니 손에 잡기 쉽게 직육면체 모양으로 생긴 연마용 스폰지가 집에 있었다는 것이 생각이 났다. 손가락 피부는 이미 엉망이 되었지만 어쩌겠는가. 녹 제거가 끝난 뒤에는 WD-40을 바른 뒤 마른 걸레로 닦아내었다.


사포질 전의 녹이 심하게 슨 상태의 사진을 찍어놓지 않아서 비교가 되지는 않는다. 마음 같아서는 손잡이 부분을 좀 더 벗겨낸 뒤 검정색 스프레이 래커를 칠하고 싶었다. 그러나 얇게 여러번 칠을 하고 잘 말리는 것도 성가신 일이라 그냥 두었다.

녹은 이렇게 힘들여 제거하였으나 날을 가는 일을 빼먹을 수는 없다. 칼갈이 아저씨를 동네에서 만나는 행운을 기대하든지, 아니면 보다 적극적으로 유성 5일장을 찾아가든지.

2018년 1월 12일 금요일

새로운 유전체 분석 서비스, GoSeqIt Tools

이틀 전, 낯선 곳으로부터 이메일이 왔다.

New web-platform for WGS-based bacterial characterisation

생명과학 연구를 위한 각종 키트나 서비스에 대한 광고성 메일을 종종 받지만, 내가 평소에 하는 업무와 관련하여 이렇게 매우 구체적인 안내 메일이 온 것은 매우 드문 일이다. 웹 주소(http://www.goseqit.com/)를 보면 전형적인 회사이다. 클릭을 하여 보았다. 덴마크 공과대학교(DTU)의 Center for Genomic Epidemiology(CGE)에서 매우 최근에 창업한 기업이었다. CGE에서는 20 가지 이상의 분석 도구를 보유하고 있는데, 이를 좀 더 사용자 친화적 및 안정적으로 제공하기 위하여 기업화를 한 것으로 보인다.

GoSeqIt에서 현재 서비스하는 분석 도구는 전부 peer-review journal을 통하여 발표된 것으로 다음과 같다.

  1. Species identification
  2. Multilocus sequence typing (MLST)
  3. Identification of acquired antibiotic resistance genes and point mutations in chromosomal genes causing antimicrobial resistance
  4. Identification of virulence factors for Escherichia coli, Staphylococcus aureus, Enterococcus, and Listeria
  5. Identification of plasmids for Enterbacteriaceae and gram-positive bacteria
  6. Plasmid multilocus sequence typing, pMLST, for plasmids of the type IncN, IncHI1, IncHI2, IncF, and IncA/C
  7. Identification of serotype for E. coli
  8. Identification of FimH type for E. coli
GoSeqIt에서 사용하는 데이터베이스는 CGE의 것보다 더 빨리 업데이트가 된다고 한다. 또한 아마존 클라우드 안에서 돌아가므로 매우 빠르고 안정적이라고 자랑을 하였다. 유튜브에서는 등록 및 사용 방법에 대한 동영상이 올라와 있다.
새로 등록한 사용자에게는 100개의 무료 CoSeqIt "coin"을 지급한다고 하였다. 등록을 하니 application을 돌릴 때마다 비용이 나가는 것처럼 보였다. 등록 후 첫 화면에서  "내 지갑"을 가 보았다.


코인의 최소 구입 단위는 200(125 달러)이다. 파일은 웹 브라우저 내에 drop을 하여 제출한다. 새로운 파이프라인의 가격은 1~4 코인 수준이고, ContigAnalyzer는 무료이다. 9개 도구 중에서 원하는 것을 골라서 파이프라인을 만들고, 새 프로젝트를 설정한 다음, 파일을 업로드하여 분석을 진행하면 되는 구조이다. 샘플 파일에 비례하여 비용이 올라가는 것 같지는 않다. 왜냐하면 코인 지불은 파이프라인 생성 단계에서 하기 때문이다. 업로드 가능한 샘플 파일은 high-throughput sequencing raw data는 안되고 오직 contig/genome level의 파일인 것으로 파악된다. 

ContigAnalyzer tool 하나만으로 구성된 파이프라인을 만든 다음 어제 NCBI에 등록하느라 사용했던 박테리아 genome assembly 두 개를 올려보았다. 리포트는 웹 브라우저에서 볼 수도 있고 PDF 파일로 다운받을 수도 있다.

유료라는 것이 아쉽지만 매우 신선한 발상의 서비스가 아닌가? 여러개의 샘플 파일을 올린 경우 하나로 통합된 리포트가 나온다면 더 좋을 것이다. 앞으로 관심을 갖고 활용해 보련다.


 

2018년 1월 7일 일요일

독서 기록 - 전문가의 독재(The Tyranny of Experts) 및 대량살상 수학무기(Weapons of Math Destruction)

내가 즐겨 읽는 책은 바로 이런 부류의 것들이다. 요즘은 여기에 더하여 소설책을 읽으려고 노력하는 중이다.


전문가의 독재(The Tyranny of Experts)

  • 윌리엄 이스털리(링크) 지음
  • 김홍식 옮김
'빈 서판(書板; 라틴어 tabula rasa, 영어로는 blank slate)'이라는 개념이 있다. 종이와 펜이 귀하던 시절, 학생들은 수업시간에 서판에 글씨를 쓰고 지우고를 반복했을 것이다. 빈 서판 이론은 인간의 본성은 타고난 것이 적다는 철학적 이론이다. 즉 깨끗이 닦인 빈 서판에 글씨를 쓰듯이 교육을 통해서 인간에게는 그 어떤 생각이든 가르칠 수(주입할 수) 있고 또 어떤 사람이든 될 수 있다는 뜻이다. 경제발전으로 가난한 나라를 일으켜 세우는 것도 빈 서판에 글씨를 써 내려가듯이(역사적·지리적 맥락을 무시하고) 가능하다는 것도 이 이론에 바탕을 둔 것으로 본다. 즉 테크노크라트(기술관료)적 접근 - 전문가들이 문제점을 진단하고 빈곤 해결을 위한 방안을 수립하여 정부는 이를 강력하게 추진 - 이 반드시 필요하고 그 과정에서 어느 정도의 '인자한 독재자(우리에게는 박정희라는 사례가 있다)'가 능력을 발휘한다는 것이 일반적인 믿음이다. 그러나 저자 이스털리는 이것은 일종의 환상이며, 가난한 나라에 부족한 것은 기술이나 정책이 아니라 개인의 권리라는 것을 주장하고 있다.

부유한 서방 세계에서 20세기 초반 가난한 나라에 대한 원조가 시작된 것은 보편적인 인권 개념과는 무관한 것이었다. 동아시아에서 존재했었던 '인자한 독재자'에 의한 경제적 발전은 허구이다. 국가의 중요성을 부정하는 것은 아니지만, 가난한 자들의 권리를 신장시키는 것이 경제적 번영을 일구어 나가는 근본적인 요인이 된다는 것이다.

빈곤이 전문적인 능력의 부족에서 비롯된다고 믿는 테크노트라트적 환상은 새로운 권력과 정당성을 자연스럽게 국가에게 안긴다. 그러나 기술적 문제는 빈곤의 여러 <증상> 중 하나이지, 빈곤의 <원인>이 아니며, 빈곤의 원인은 정치적, 권리적 권리의 부재라는 것이 이 책의 일관적인 주장이다.

15세기 중반까지만 해도 유럽보다 우월한 삶을 영위했던 중국은 왜 그 후에 몰락하였나? 똑같은 식민지였으면서도 왜 북미와 남미는 이렇게 다른 길을 걸어가게 되었나? 현재의 경제적 번영은 개방과 국외 무역을 중시하고 엘리트의 독식 구조를 타파하며 개인의 권리를 위해 오랜 기간 투쟁해온 공동체·나라들의 손에 돌아갔다는 것을 역사가 증명하고 있다.

이 책은 특히 탐욕스런 자본주의의 정신의 지주로 일컬어지는 애덤 스미스의 인용문은 실제로 가장 잘못 이해되고 있는 것이라고 하였다(p.375~).
개인들은 최대한 많은 가치를 생산하려고 부단히도 자기 일에 주력한다. 자신의 이득만을 보고 하는 일이지만, 다른 많은 일에서도 그렇듯 개인은 이런 식으로 보이지 않는 손에 인도되어 자신이 전혀 의도하지 않았던 목적에 기여하게 된다. 그가 의도하지 않아다고 해서 꼭 사회에 나쁜 것은 아니다. 사람들이 공익에 기여하기를 바랄 때보다, 오히려 그런 생각 없이 자신의 이익을 추구하는 바로 그 행위가 공익에 더 효과적으로 기여할 때가 많다.
이 인용구에 대한 가장 큰 오해는 스미스가 <탐욕은 좋은 것>이라고 생각했다는 것이다. 하지만 그는 독점의 폐해를 분명히 지적하였다. 스미스가 주장한 자유 시장은 기존의 상인을 더 부자가 되게 만들자는 것이 아니라 그들의 독점권과 특권을 박탈하여 그들의 부를 줄이자는 것이었다. 그가 주양한 자유 무역은 빈곤층을 위한 저렴한 식량의 수입을 촉진하여 그러한 거대 지주들을 약화시키는 것이었다(p.377).

이 책의 2장에서 소개한 프리드리히 하이에크와 군나르 뮈르달에 대한 공부가 숙제로 남았다. 아울러서 진정한 '자유'와 '권리'란 무엇인지에 대해서도 말이다. 특히 우리나라만큼 자유주의의 의미가 왜곡되어 쓰이는 곳도 흔치는 않을 것이다.

대량살상 수학무기(Weapons of Math Destruction)

수학이라는 멋진 도구를 현실 세계에 반영한다는 것은 '더 멋진' 일이 아닐 수 없다. 그러나 이 도구가 자본에 종속되어 사람들의 권리를 침해하고 약탈자로 둔갑하기 시작하였다. 그럼에도 불구하고 우리나라에서는 공공 데이터(요즘 유행하는 빅데이터)를 이용하여 비즈니스 기회를 창출하지 못하면 제4차 산업혁명시대에 당장 뒤쳐질것이라는 불안감을 이용한 마케팅이 횡행하고 있다.

방대한 분량의 데이터를 분석하여 지혜로운 판단을 내리려는 것은 매우 합리적인 행동이다. 이 과정에서 수학과 인공지능이라는 기법이 필수적으로 쓰인다. 이를 위해서는 데이터를 이용하여 어떤 수학적 모델(모형)을 만드는 것이 필요하다. 서두에서 저자는 다음과 같이 분명하게 밝혔다.
우리는 개인이든 기업이든 누가 모형을 만들었는지, 그리고 개발자가 모형을 통해 성취하려는 목표가 무엇인지 알아야 한다.
개인은 저마다 다 다르다. 인간의 뇌는 이를 적당히 구분짓는 놀라운 능력을 갖고 있다. 아마 이것은 맹수에 쫓기고 야만인의 위협을 받던 오래 전에 진화적으로 만들어진 능력일 것이다. 내가 생활자금이 부족해서 금융권으로 대출 심사를 받으려고 하는데, '당신은 이러이러해서 부적격자이므로 대출이 불가합니다'가 아니라 '당신은 우리가 수집한 정보에 의하면 이러이러한 세부 그룹에 속하는 사람이고, 그 그룹은 대출금을 상환할 능력이 없다는 것이 우리의 판단이니, 대출이 불가합니다'라는 판정을 받는다면?

이 책은 수학이라는 도구 자체를 불신하는 것은 아니다(제목만 보면 오해를 하기 쉽다). 요리사의 손에 들린 칼과 강도의 손에 들린 칼이 그 의미가 다르듯이, 도구를 쥔 자가 어떤 의도를 갖고 있는지를 중요시해야 한다. 피터 드러커가 이런 말을 했다고 한다.
If you can't measure, you can't manage. (측정하지 못하면 관리하지 못한다 - 즉 개선할 수 없다)
이것에 대한 반론(fobes에 실린 글 - 나중에 읽어보자)도 물론 존재한다.

우리는 모두 측정과 줄 세우기의 노예가 되었다! 교육 예산이 부족하니 무능한 교사를 퇴출하기 위해서, 연구 예산이 부족하니 불량한 과제를 자르기 위하여, 기업의 경영상태가 부실하니 저성과자를 내보내기 위하여, 신입사원 50명을 뽑는데 2,000명이 원서를 냈으니 이중에서 적합한 자를 사전 선별하기 위하여...

생존권이 달린 문제를 놓고 누군가는 이들을 줄을 세워 잘라야 한다. 하지만 뒷말이 없는 공정한 기준을 만드는 것 자체가 힘들고, 선정 과정에 들여야 할 노력도 엄청나다. 이를 위해서 나름대로 정교하게 만들어졌다고 주장하는 수학적 모델을 도입하는 것으로 면죄부를 주려한다. 그러나 이러한 수학적 모델이 이용하는 변수들은 불완전하고, 변수를 수집하는 과정에서 인권 침해의 여지가 다분하고, 알고리즘도 완벽하지 않으며, 영업 기밀이라는 이유로 공개는커녕 피드백도 허용하지 않는다. 과거에 인기를 끌었던 비과학적 골상학에 디지털이라는 기술을 입힌 것에 불과하다. 이 책에서는 이와 관련한 많은 사례를 소개하였다.

이 책의 223쪽에 나온 사례를 소개해 보겠다. 뱅크오브아메리카에서는 팀별 생산성의 차이가 나는 이류를 알기 위해 직원들에게 socio-metric batch를 6주간 착용하여 그들의 동선과 어조 및 제스쳐를 16 밀리초 간격으로 측정하였다. 그 결과는 놀라웠다. 동료간의 대화가 많은 팀이 고객의 요구에 가장 신속하고 효율적으로 반응했다고 한다. 만약 근무태도에 대한 일반적인 수학 모형을 만든다면 동료와 대화하는데 많은 시간을 들인 사람은 단순히 노닥거리면서 시간을 낭비한 사람으로 낙인을 찍게 될 것이다.

빅데이터를 이용하면 헬스케어 또는 웰니스 분야에서 엄청난 사업 기회가 생길 것이라고 많은 사람들이 기대를 한다. 그러나 이것도 프라이버시 침해와 강제성 문제가 생길 수 있다. 어렵사리 직업을 구한 뒤 정식으로 입사하기 전에 건강검진을 받는 것을 요즘은 당연한 것으로 생각하지만, 조금만 다른 방법으로 생각해 본다면 이것은 또 다른 차별적 요인일 수도 있는 것이다.

337쪽의 결론 부분을 이용하는 것으로 독서 기록을 마치고자 한다.
데이터 처리 과정은 과거를 코드화할 뿐, 미래를 창조하지 않는다. 미래를 창조하려면 도덕적 상상력이 필요하다. 그런 능력은 오직 인간만이 가지고 있다.
(339쪽) 2008년 금융시장이 붕괴한 이후에 금융공학자 이매뉴얼 더만과 폴 윌모트는 실제로 모형 개발자를 위한 히포크라테스 선서를 작성했다.

  • 나는 내가 세상을 만드는 것이 아니며, 세상이 내 방정식을 따르지 않음을 명심하겠습니다.
  • 나는 가치를 추산하기 위해 모형을 대담하게 사용할지언정, 수학에 지나치게 감동받지는 않겠습니다.
  • 나는 이유를 설명하지 않고는 우아함때문에 현실을 결코 희생시키지 않겠습니다.
  • 나는 내 모형을 사용하는 사람들이 그 정확성에 대한 거짓된 위안을 갖도록 하지 않겠습니다. 대신에 나는 모형에 이용된 가정과 간과된 점들을 분명히 밝히겠습니다.
  • 나는 내 일이 사회와 경제에 지대한 영향을 끼칠 수 있음을, 그런 영향의 상당 부분이 나의 이해 수준을 능가하는 것임을 명심하겠습니다.

2018년 1월 5일 금요일

사람이 센서(sensor)가 된 시대

과거에는 개인과 관련된 기록이라 하면 학창시절의 성적표나 생활기록부, 주거지 정보, 주변사람들의 평판, 손으로 쓴 글씨, 직장의 인사 기록, 인화한 사진 정도가 전부였을 것이다. 이런 기록이 이제 디지털화하여 전송과 보관 및 분석이 용이한 형태로 바뀌고 있다. 게다가 모바일 기기나 인터넷에 접속된 PC를 이용하여 하루 동안에만도 엄청난 데이터를 생산하게 되었다. 또한 의료나 금융, 쇼핑 등과 관련한 수많은 정보가 의식하지 못하는 사이에 이러한 기기를 통하여 어디론가 흘러간다.

구글에서 humans as sensors로 검색을 해 보라. 상당히 많은 글들을 접하게 될 것이다.

사람은 데이터를 만드는 주체이기도 하지만 유선전화, 모바일 기기 그리고 PC를 사용하면서 아주 자연스런 데이터의 전송 포인트가 되었다. 즉 컴퓨터에 연결된 '센서'가 되기를 자처한 것이다. 이를 이용하면 거대한 규모의 비즈니스 기회를 창출하는데 도움이 될 수 있다. 이렇게 양산된 정보를 기업에서 편하게 쓸 수 있게 해 달라는 요구도 점점 커지는 추세이다. 'AI'를 이용하여 '빅데이터'를 주무르지 않으면 '제4차 산업혁명시대'에 뒤쳐질지도 모른다는 '불안감 마케팅'이 우리 주변을 안개처럼 휘감고 있는 것이다.

인간은 데이터 자체이기도 하고, 데이터를 수집하는 센서이기도 하고, 이를 인터넷 저편의 어딘가로 자발적으로 보내주는 일종의 data acquisition board이기도 하다. 90년대 후반 철없던 postdoc 시절에 매만졌던 Advantech과 LabVIEW 제품이 떠오른다.

경향신문의 2018 신년기획 "헌법 11.0 다시 쓰는 시민계약"에서는 지난 1월 3일 인간은 데이터, IT 기업이 '신'이된 세상이라는 기사(링크)를 실었다. 내 정보를 내가 통제할 수 있어야 한다는 기본권이 현재의 헌법에서 충분히 보장되고 있는가? 모든 것이 경제 논리에 파묻히고 있다. 조금 전에 읽기를 마친 캐시 오닐의 책 <대량살상 수학무기(Weapons of Math Destruction - 대량살상무기는 Weapons of Mass Destruction이다)>은 많은 것을 생각하게 하였다. 이 책에 대한 독서 기록은 별도의 블로그 포스트로 남길 예정이다.

개방은 미덕일 수 있다. 그러나 이윤 증대, 비용 감소만을 목표로 하는 기업에서 이를 가져다가 불완전한 데이터 모형을 만들고 이를 개선할 피드백은 전혀 받지 않은채 알고리즘을 만들며, 이를 사용하여 대중을 제멋대로 구분, 대출광고를 뿌리고 채용 과정에서 불이익을 받게 만든다. 책에서 소개한 많은 사례 중 이것은 극히 일부이다. 그런데 정작 불이익을 당한 우리는 그러한 데이터 모형과 알고리즘에 대해서 알지 못한다. 기업은 개방화를 외치면서 우리의 데이터를 갖다 쓰지만, 그들이 구축한 방법은 영업 기밀이라는 이유로 개방하지 않는 이중 잣대를 들이대는 것이다.

수학과 IT는 멋진 도구이다. 그 자체는 가치 중립적이다. 마찬가지로 칼과 망치와 톱도 멋진 도구이다. 그러나 흉악범의 손에 칼과 망치와 톱이 들리면 무시무시한 흉기로 변한다. 이 도구는 요리사와 목수의 손에서 선한 의도로 쓰일 때 비로소 인류에게 유익한 역할을 할 수 있는 것이다.

생각하지 않고 저항하지 않으면 우리의 기본적인 권리가 잊혀진다. 더 이상 수동 소자가 되기를 자처하지 말자. 인간은 지성적인 존재이므로.

2018년 1월 4일 목요일

우분투 노틸러스에서 SSH로 다른 컴퓨터 연결하기

개인적으로 유전체 시퀀싱 자료를 꽤 많이 보유한 편이라서 나름대로의 백업 대책을 수립하여 이를 준수하기 위해 노력하고 있다. 아주 오래된 것은 SATA HDD에 기록하여 문짝이 달린 책장에 보관하며, 가끔 꺼내보는 것은 DAS에, 최근 것은 주로 사용하는 리눅스 컴퓨터의 파일 시스템 안에 둔다.

꽤 오래전에 시퀀싱한 raw data file을 사용할 일이 생겨서 책장에서 HDD를 꺼내들었다. 데이터 파일 이름이 s_4_sequence의 형태이니 정말 오래전의 일루미나 자료가 아니겠는가? 아마도 2009년 말에 시퀀싱이 된 것으로 기억한다. 새로텍 PROBOX Docking Station(DP-20U3-6G)에 HDD를 장착한 뒤 우분투 데스크탑(14.04)이 설치된 컴퓨터에 연결하였다. 업무용 컴퓨터(Windows 7)에 연결하면 직장의 USB 매체 관리 시스템에 등록을 요청해야 하므로 좀 번거롭다. 리눅스를 통해 우회하는 것은 보안 규정 위반인가? 그렇다고 볼 수는 없다. 만약 그렇다면 리눅스를 쓰는 것 자체를 금지해야 할 것이다.


성공적으로 인식이 되었으니 이를 주 작업용 서버(진공관 앰프에 관심이 많던 시절에 구입한 것이라서 tube라고 부름)로 전송해야 한다. 터미널 창을 열고 scp 명령을 입력하려다가 얼핏 이런 생각이 들었다. '노틸러스 파일관리자 창에서 접속을 한 뒤 마우스로 끌어서 복사해도 될텐데 왜 내가 command line을 치고 있지?'


왼쪽 맨 아래에서 'Connect to Server'를 클릭하여 나오는 창에 ssh://ip주소:port번호를 입력하면 계정명과 암호를 넣으라는 창이 뜬다. 필요한 정보를 넣고 나면 다음과 같이 창이 열린다.


이렇게 편리한 것을 왜 지금껏 쓰지 않았나 모르겠다. 하지만 MS 윈도우와 리눅스 사이에서 파일을 전송할 때에는 전적으로 sftp(Xmanager Enterprise)만 사용한다. 게으른 탓도 있지만 이것이 좀 더 안전할지도 모른다는 생각에서다. 

Samba를 이용하여 리눅스와 윈도우 사이의 파일 교환 및 프린터 사용을 되게 하느라 고생하던 기억이 새롭다. 당시 사용하던 프린터가 HP DJ505K였던가? alt.binaries.pictures.supermodels 뉴스그룹에서 슈퍼모델 신디 크로퍼드의 사진을 받아서 인쇄했던 기억이 난다. 아이고, 신디 누님은 1966년생이로구나...

리파마이신(rifamycin), 리팜피신(rifampicin), 그리고 리팜핀(rifampin)의 차이

세 가지 용어의 정확한 차이를 알기 위하여 구글에게 물어보았다. 가장 상위 개념이라고 할 수 있는 리파마이신(rifamycin)은 Amycolatopsis rifamycinica(NCBI taxonomy)라는 세균에서 얻어지는 천연 상태의 항생제 혹은 이로부터 유도된 반합성 화합물을 통틀어 일컫는 용어이다. 최초 발견자가 프랑스 범죄소설 를 특히 좋아해서 이 물질을 리파마이신이라 부르기로 했다고 한다. 이것은 1957년의 일이다. 처음에 발견된 것은 리파마이신 A, B, C, D, E의 혼합물이었고 이 중에서 충분히 안정하여 순수하게 분리할 수 있는 것은 오직 리파마이신 B였다. 하지만 효능은 좋지 못하였다. 연구를 지속한 결과 리파마이신 B는 근본적으로 활성이 없지만, 수용액 내에서 자발적인 반응을 거쳐서 효능이 매우 우수한 리파마이신 S가 되고, 이를 환원시키면 하이드로퀴논 형태인 리파마이신 SV가 된다. 리파마이신 SV는 이 계통의 항생제 중에서는 임상에서 처음 쓰인 약이다(주사제).

출처: https://en.wikipedia.org/wiki/Rifamycin
리파마이신은 세균의 RNA polymerase beta subunit에 결합하여 그 작용을 저해함으로써 세균의 성장을 막는 bacteriocidal antibiotic이다. TAQ RNA polymerase와 리팜피신이 결합한 콤플렉스의 입체 구조를 다음의 URL에서 볼 수 있다.

https://www.ncbi.nlm.nih.gov/Structure/pdb/1YNN

윗부분의 갈색 뭉치가 RNA polymerase 베타 서브유니트이다. 리팜피신은 가운데에 위치한 조그마한 흰색 구조체이다.
1959년에는 효율이 좋고 내약성이 우수한 새로운 분자, 즉 '리팜피신'이 개발되었다. 리팜핀은 리파마이신을 미국에서 부르는 말이라고 한다. 리팜피신은 먹는 약으로서 결핵 치료에 주로 쓰여왔다. 내성이 잘 유발되기에 일반적으로 다른 항생제와 같이 쓰인다고 한다.

리팜피신의 상품 브랜드 명으로는 Rifadin, Rimactane 등이 있다. 리팜피신에 대하여 왜 미국에서만 리팜핀이라는 다른 이름이 생겨났는지는 확인하지 못하였다.

2018년 1월 1일 월요일

독서 기록 - 유발 하라리의 <사피엔스> <호모 데우스> 외 5권

2017년 마지막 주를 남은 연차휴가로 집에서 편하게 보내면서 꼭 읽으리라고 다짐했던 유발 하라리의 책 <사피엔스>와 <호모 데우스>를 드디어 읽었다. 두 권의 책을 합치면 총 1천 페이지를 훨씬 넘는 방대한 분량인데, 약 3일에 걸쳐서 정신없이 읽었다.


<사피엔스>는 인류의 역사를, <호모 데우스(Homo deus; deus = 신)>는 신의 영역에 도달한 인간의 미래를 그린 책이다. <사피엔스>가 폭발적인 인기를 끌고 저자가 방한까지 하자 '한국은 우리의 문제를 남(외국)에서 답하려는 얼빠진 사회'라는 비판까지 일었다. 마치 마이클 샌델의 '정의란 무엇인가'가 우리나라에서 인기를 끌었던 것과 비슷한 현상으로 보려는 것이다. 정작 저자의 나라에서는 별로 주목을 받지 못했던 책이 운좋게 시류에 적절한 순간 출간되어 우리나라에만 인기를 끌면서 수십만권 이상이 팔리고, 이를 무비판적으로 받아들이고, 이러한 반짝 인기에 편승하여 저자의 방한 이벤트를 통해 이득을 보려는 숨겨진 상술을 경계하려는 것이다. 인공지능·빅데이터·제4차 산업혁명에 대한 관심이 요즘 부쩍 높아진 것도 유발 하라리의 책에 대중이 관심을 쏟게 만든 원인 중 하나가 아닐까 한다. 어쩌면 이 주제는 유난히 한국에서만 부상하고 있는지도 모르겠지만 말이다.

[세계일보-박정진의 청신청담] 사피엔스, 인간의 내장된 종말 읽게 해
[한국일보] 사피엔스 저자 유발 하라리는 제국주의자다

여러 부정적인 시각이 있음에도 불구하고 이 두 권의 책은 매우 큰 흡인력을 갖고 있다. 인류의 역사와 미래에 대해서 큰 질문을 던지고 이에 대하여 탐구하듯이 쓴 책은 흔하지 않다고 생각한다. 책을 읽는 내내 '유발 하라리는 역사학자가 맞나? 혹시 IT나 BT 전공자는 아닌가?'하는 생각이 들 지경이었다. 에드워드 윌슨의 <통섭>이나  제래드 다이아몬드의 <총, 균, 쇠>를 연상하지 않을 수가 없었다.

스토리텔링은 유려하지만, '사피엔스'에 구체적인 내용이 없다는 비판도 있다. 아마도 '앞으로 어떻게 하라는 거냐'라는 대안 제시가 부족하다는 뜻으로 받아들여야 할 것이다. 이에 대해서는 후편인 <호모 데우스>를 통해서 '앞으로 어떻게 것이다'에 대한 예측은 충분히 내세웠다고 생각한다. 시나 소설가에게 대안을 제시하라고 할 필요는 없듯이 말이다.

따라서 이 두 권의 책은 반드시 같이 읽어야 한다. <사피엔스>에서는 다른 동물들 사이에서 별볼일 없던 인간이 어떻게 '인지 혁명'을 통해서 지금의 문명을 이루었는지를 서술하였다. 보이지 않는 실재(그것이 비록 허상에 불과한 것이라 하여도)를 동료들에게 인지시키고 이로 말미암아 공동 목표의 달성을 위한 협력을 이끌어낸 것이 지구상에 인간의 세상을 만들어낸 주된 원인으로 파악하였다. 눈에 당장 보이지 않는 실재라는 것인 종교일 수도 있고 국가사회일 수도 있고 공익의 추구일 수도 있다.

<호모 데우스>의 결론 부분을 인용해 본다(맨 마지막쪽인 554쪽).

  1. 과학은 모든 것을 아우르는 하나의 교의로 수렴하고 있고, 이 교의에 따르면 유기체는 알고리즘이며 생명은 하나의 데이터 처리 과정이다.
  2. 지능이 의식에서 분리되고 있다.
  3. 의식은 없지만 지능이 매우 높은 알고리즘이 곧 우리보다 우리 자신을 더 잘 알게 될 것이다.
이에 대해서 인간은 영적인 존재임을 믿는 기독교인들은 강하게 반발할 것이다. 하지만 나는 이 세 가지 결론에 대하여 전적으로 동감한다. 이미 의식과 무관하게 인공적인 지능이 우리 주변에서 필요한 일을 수행하고 있다. 우리가 의식 또는 자아라 믿는 것 자체도 매우 정직하지 못하다는 것이 현대 신경과학의 결론 아니었던가? 

의식, 자아, 감정, 경험, 기억 - 이 모든 것은 신경세포의 발화와 신호전달물질의 정교한 '뒤범벅'에 의한 결과라는 것이 나의 결론이다. 지나친 유물론적인 해석이 아니냐고 비판해도 좋다. 세포와 개체가 단지 유전자의 전달자를 위한 도구('생존 기계' - 리처드 도킨스의 입장)라고 해도 좋다. 물리적·화학적 현상에 우리의 정신 활동이 기반한다고 해서 그것이 무가치하다고 생각하지는 않는다. 어쨌든 나는 외부 자극에 반응하고 무엇인가를 느끼고 있으니까 말이다. 그리고 나를 포함한 되도록 많은 사람들이 행복한 감정을 느끼면서 살아가도록 노력하고 협력하는 것은 분명히 의미있는 일이다. 

나머지 책은 제목과 저자를 소개하는 선에서 간략하게 끝내기로 한다.
  • 역사학자 정기문의 식사(食史) - 생존에서 쾌락으로 이어진 음식의 연대기
  • 명견만리 우리가 준비해야 할 미래의 기회를 말하다 (윤리, 기술, 중국, 교육 편) - KBS <명견만리> 제작팀 지음
  • 츠바키 문구점 - 오가와 이토 지음|권남희 옮김. 나의 얄팍한 경험으로 일본의 문화예술을 논한다는 것은 대단히 부적절할 것이다. <심야 식당> <앙: 단팥 인생 이야기> <세상의 끝에서 커피 한 잔> 등 내가 보았던 일본 영화의 중요 공식이 잘 나타난 소설이다. 즉 소소한 일상, 가업, 음식에 대한 상세한 묘사, 힐링이 되는 분위기 등. 이 소설은 주인공 하메미야 하토코는 도쿄에서 멀지 않은 가마쿠라에서 문구점을 운영한다(이 문구점은 가공의 것이지만 소설에서 소개된 관광지, 절, 음식점 등은 실제 존재하는 곳이다). 주인공이 물려받은 가업은 대필, 즉 고객이 의뢰한 편지를 대신 써 주는 일이다. 연말에는 연하장과 같은 의례적인 편지를 쓰느라 몹시 바쁘다. 하지만 지인이 키우던 원숭이가 죽은 것을 위로하는 조문 편지, 주변 사람들에게 의뢰자 부부가 이혼했음을 알리는 편지, 돈을 빌려달라는 부탁을 거절하는 편지 등 저마다의 사연을 가진 의뢰자가 츠바키 문구점을 찾아서 차 한잔을 앞에 놓고 마음을 열면서 필요한 편지 내용을 알려주고, 주인공은 의뢰자의 마음이 되어서 편지를 공들여 쓴다. 대부분의 경우 편지의 최종안을 의뢰인이 확인하지는 않는다. 그만큼 대필가를 신뢰한다는 뜻이 될 것이다. 주인공이 어떤 펜과 잉크, 종이, 봉투 및 우표를 사용했는지에 대한 상세히 설명한 것이 이채로왔고, 일년에 한 번 의뢰인이 편지를 보내주면(예를 들어 젊은 시절 주고받은 러브레터를 언제나 갖고 있을 수도 없고, 쓰레기통에 버릴 수도 없는 노릇이니) 이를 정성스럽게 태우는 의식을 치러준다는 것도 나의 흥미를 끌었다. 수고비는 미사용 우표를 같이 부치는 것으로 대신한다. 권 말미에는 소설 속에서 쓴 손글씨 편지가 소개되었다. 읽으면서 마음이 따뜻해지는 소설이었다.
  • 세월호 참사 팩트체크: 밝혀진 것과 밝혀야 할 것 - 416세월호참사 국민조사위원회 지음
  • 사라지는 미래 인구축소가 가져오는 경제와 시장의 대변환 - 김성일, 정창호 지음. 시장 없는 인구는 존재해도, 인구 없는 시장은 존재하지 않는다. 우리가 미처 신경을 쓰지 못하는 동안 우리나라의 인구 구조는 도저히 되돌릴 수 없는 상태로 비가역적인 변화를 겪고 말았다. 인구 축소 = 시장 축소의 데모-디플레이션 시대를 맞이한 것이다. 이제 성장을 최고의 가치로 삼던 , 즉 팽창의 경제 시대는 다시 오지 않을 것이다. 이에 대한 해결책 중 하나로 기업 소득 환류 세제(기업의 사내 보유 현금성 자산에 대한 과세)를 제시하였으며, 아이를 낳은 엄마를 존경하는 사회 분위기 조성이 필요함을 열설하였다.

2018년 새해 벽두부터 끊이지 않는 자잘한 사고

가족 여행을 갔다가 면도기에 손가락을 베고,
딸아이는 휴대폰을 잃어버렸다가 되찾고(블로그 포스트 링크),
자다가 아내의 팔꿈치에 부딛혀서 입술이 터지고,
새해 첫날부터 깨진 변기 백시멘트 보수 작업을 하다가 물탱크에 물을 공급하는 수도꼭지를 잘못 건드려 배관이 파손되고...
이 '재앙'은 현재진행형이다. 냉수를 차단할 수밖에 없어서 난민촌이다 다를 바가 없는 상황이 되고 말았다. 타일을 깨고 수도관 접합부를 드러내는 대공사가 벌어질지도 모른다.
이것 말고도 공개하기 어려운 가정 사정이 발생하고...

새해를 맞이하여 특별히 다짐을 한 것도 없이 평소와 다름없는 새날을 맞으리라고 생각했는데 시작부터 의욕이 꺾이는 일이 이렇게 많이 발생할 줄은 정말 몰랐다.

그래도 어쩌랴. 어떻게든 살아 나가야 한다.


서울에서 잃어버린 휴대폰이 청주에서 발견된 황당무계한 사연

이틀 전, 가족과 함께 버스를 타고 서울 강남고속버스터미널에 도착하였다. 하차 직후 화장실에 다녀온 딸아이가 휴대폰이 보이지 않는다고 하였다. 아내와 함께 방금 전에 들른 화장실에 가 보라고 하였다. 아내와 딸은 화장실 칸막이를 두드리며 혹시 안에 휴대폰이 떨어져있지 않느냐고 다급하게 물어보았다고 한다. 그런데 아무 대답도 없이 한참만에 젊은 아가씨가 후다닥 튀어나갔다고 한다. 그 여자가 휴대폰을 주워서 달아났을지도 모른다는 합리적 의심이 들지만 심정만으로는 어떻게 할 수는 없었다.

어쩌면 대전에서 타고 온 버스에 흘렸을 가능성도 있다. 딸아이는 버스에서 내리면서 주머니에 있는 것을 확인했다고 하지만 착각이었을수도 있으니 말이다. 혹시나 싶어서 소화물 센터에 가니 우리가 타고 온 고속버스 회사의 사무실에 가 보라고 하였다. 해당 사무소를 경유하여 정비 후 쉬고 있는 버스까지 직접 찾아가서 딸아이가 앉았던 자리 근처를 다시 뒤져보았지만 아무것도 남은 것은 없었다.

잃어버린 휴대폰으로 전화를 계속 걸어보았다. 신호는 가지만 받지를 않는다. 진동도 아닌 무음상태라서 벨이 울려도 이를 주변에 있는 사람이 눈치채기가 아주 어려운 상황이었다. 일단 통신사 고객센터에 전화를 하여 분실 신고를 하였다. 휴대폰 위치를 찾는 앱을 알려주었지만 이것은 분실 전에 가입을 하지 않으면 소용이 없는 것이었다. 휴대폰에는 패턴이 걸린 상태라서 그나마 다행이었다. 사실 패턴이 걸려있다 해도 공장 초기화는 가능하다. 이런 상태에서 중고로 팔아넘기면 분실 신고가 된 경우 개통단계에서 확인이 된다. 그러나 통신사 대리점 현장에서 '분실 신고된 단말기를 들고 오셨군요. 이를 압류하고 당신은 처벌합니다.'할 수는 없다. 그 사람은 제3자에게서 중고 거래를 통해 분실 혹은 절도 휴대폰인지를 모르고 구입한 것일 수도 있으니까.

하까 화장실에서 마주친 그 젊은 여성이 바닥에 떨어진 휴대폰을 주워서 도망간 것일까? 결국 쓸모가 없으니 어느 쓰레기통에 버려져서 영영 찾지 못하게 되는 것은 아닐까? 이렇게 남이 잃어버리거나 훔친 휴대폰은 분실신고가 된 경우 국내에서는 쓰지 못하므로 국외에 밀수출할 용도로 매입하는 업자가 있다고 하는데, 하루만 지나면 이런 업자에게 넘어가게 되는 것은 아닐까?

나는 이제 포기하라고 하였지만 딸아이는 아직 배터리가 남아서 신호가 간다면서 잃어버린휴대폰으로 계속 전화를 걸었다. 다음날이 되어서 서울 시내를 돌아다니느라 지하철을 타고 이동하는 도중 딸아이가 다시 전화를 걸었는데, 놀랍게도 누군가가 전화를 받았다! 잃어버린 휴대폰인데 혹시 거기가 어디냐고 물으니 고속버스 소화물 센터라는 것이다. 버스 기사분이 버스 안에서 수거해 왔다는 것이다. 도대체 어떻게 된 것일까? 어제 우리가 타고 온 버스를 뒤졌는데 혹시 다른 자리에서 발견이 되었단 말인가? 즉시 오후 일정을 포기하고 고속버스터미널 소화물 센터로 방향을 바꾸었다.

어제 들렀던 소화물센터에 다시 도착하여 휴대폰을 찾으러 왔다고 했더니 맡겨진 휴대폰은 없다는 것이다. 이건 또 무슨 일인가? 다시 잃어버린 딸아이 휴대폰으로 전화를 걸었다. 우리가 제대로 찾아온 것이 맞는지 물어보았다. 그런데 대답은 놀라웠다. 휴대폰을 지금 갖고 있는 곳은 청주에 있는 중앙고속 사무실이라는 것이다.

청주? 서울고속버스터미널(강남) 경부선 하차장과 화장실로 이동하는 사이 잃어버린 휴대폰이 하루 뒤에 청주행 버스에서 발견되었다니? 가능한 시나리오는 단 하나이다. 휴대폰을 누군가 주워서 어떻게든 해 보려고 시도했지만 패턴도 걸려있고 인기있는 단말기도 아니라서 결국은 자기가 서울에서 청주로 돌아가는 버스 안에다 슬쩍 버리고 갔을 것이라는 추론이 가능하다. 그렇다면 화장실에서 마주친 그 젋은 여성이 바로 그 장본일일까? 그럴 가능성은 아주 높다.

고맙게도 청주의 중앙고속에서는 오후 2시 50분에 서울로 출발하는 버스편에 이를 보내준다고 하였다. 약 두시간 후, 우리는 휴대폰에 둘둘 감아두었던 이어폰은 사라진 상태의 온전한 휴대폰을 서울 터미널의 중앙고속 사무실에서 인수하였다. 통신사 고객센터에 전화를 걸어서 정지상태를 해지하였다.

아내가 화장실에서 마주쳤던 그 여성의 얼굴을 아직은 기억하고 있으므로 만약 신고를 하고 청주행 고속버스의 CCTV를 확인한다면 휴대폰을 가져갔던 사람을 찾아내어 처벌을 하는 것도 가능하다. 이어폰은 사라졌지만 휴대폰이 무사한 상태로 돌아왔으므로 이렇게까지 할 생각은 물론 없다. 오히려 그 '범인'이 휴대폰을 쓰레기통에 버려서 영영 찾기 어려운 상태로 만들지는 않았으니 오히려 고마워해야 할 것인가?

휴대폰을 습득하고 돌려주지 않으면 절도죄나 점유이탈물횡령죄로 처벌받을 수 있다. 예를 들어서 PC방에 두고 간 휴대폰은 PC방 관리자의 점유 하에 있으므로 제3자가 이를 가져가면 절도죄에 해당한다(참조 링크). 그러므로 잃어버린 휴대폰을 발견했다면 즉시 경찰서 등에 신고를 하거나 그 장소의 관리책임자에게 맡길 것이 아니라면 손을 대지 않는 것이 현명하다.

간혹 택시에 두고 내린 승객의 휴대폰을 돌려주는 과정에서 사례금 문제로 시비가 발생하는 경우를 본다.  최신 휴대폰이라 해도 1천만원씩 하는 귀중품은 아니지 않은가? 기사 입장에서는 원래의 주인과 연락을 하고 만나고 하는 성가신 일이 벌어지기는 하겠지만 더 살기 좋은 사회를 만들기 위한 시민의 덕목으로 생각하고 지나친 사례금을 요구하는 일은 없어야 되겠다. 유실물법 제4조에서는 보상금의 범위를 물건 가액의 5~20%로 규정하고 있지만, 휴대폰 주인이 원하는 수준의 사례금을 주지 않는다고 해서 이를 돌려주지 않으면 앞서 소개한 '점유이탈물횡령죄'로 처벌을 받을 수 있다.

마지막으로 유용한 기사 링크를 소개하는 것으로 올해 두번째 블로그 포스팅을 마친다.

스마트폰 분실 시 대처하는 법과 찾는 방법

이 글에서 소개한 것 중 구글의 내 기기 찾기(링크)를 소개한다. 안드로이드 설정 -> 잠금화면 및 보안 -> 위치 -> 사용 중 체크, 위치 인식 방식은 높은 정확도(GPS, Wi-Fi, 모바일 네트워크 사용)을 설정해 두면 휴대폰이 무음 상태에 있더라도 내 기기 찾기를 통해서 구글 지도 상에 위치 표시와 함께 최대 음량으로 5분 간 벨을 울릴 수 있다. 원격으로 휴대폰을 잠그거나 초기화하는 것도 가능하다.

주운 휴대폰을 불법으로 팔아서 얻는 이익이 이를 주인에게 돌려줬을 때의 이익보다 현저히 크다고 잘못된 판단을 하는 일이 없기를 바라면서...

궁금증 추가하기

  1. 도둑질한 휴대폰이 마침 패턴이 잠기지 않은 상태였고 분실 신고도 되지 않았다고 가정하자. 도둑이 여기에 자신의 유심칩을 끼워서 사용한다면 어떻게 될까? 아마 당장은 사용 가능할 것이다. 분실자가 나중에 분실 신고를 하면 현재 부정 사용을 하고 있는 도둑과 단말기를 찾는 것이 가능할까?
  2. 패턴 잠금이 된 휴대폰을 도둑질하여 공장 초기화를 실시하였다. 이미 분실 신고는 된 상태이다. 이 경우는 정보가 공유되어서 국내 통신사의 유심을 꽂아서는 쓰지 못한다.

2018년을 시작하면서 - 자유의지와 무작위성에 대하여

이번 2018년처럼 평소와 다름없이 무덤덤하게 새해를 시작한 것은 처음인 것 같다. 유달리 해프닝이 많았던 연말 가족여행의 여파랄까(이에 대해서는 별도의 글을 쓸 것이다), 어제 고속버스를 타고 대전에 돌아온 뒤에는 제야의 종 타종 생중계까지 이어지는 연말 특집 프로그램은 보지도 않은채 그냥 잠자리에 들고 말았다.

2018년은 개의 해, 무술년이라고 한다. 음력설은 2월 16일이다. 내가 관심이 줄어든 것인지는 모르겠으나 '황금돼지의 해' '흑룡의 해' 등 역술인과 언론인의 마케팅에 덜 놀아나는 것 같아서 성가심이 덜하다.

2018년 블로그의 첫 블로그는 영화 <컨트롤러(원제: The Adjustment Bureau (2011)>에서 데이빗 노리스(맷 데이먼)이 했던 대사로부터 시작해 본다. 기억이 정확하지는 않지만 대충 다음과 같았다.
"(인간에게) 자유 의지라는 것은 없는 겁니까?"
이 영화에서 조정국 요원들은 천사이고, 가장 높은 곳에서 이를 지휘하는 사람은 우리가 생각하는 신(또는 하느님)이라고 명백하게 선언하지는 않는다. 조정국에서는 인간이 세상을 자유롭게 만들어 나가도록 두었더니 계속 전쟁과 같은 참사가 벌어지는 것을 도저히 그대로 두고 볼 수가 없어서 직접 계획에 쓰여진대로 인간이 행동하도록 주변 여건을 조작하는데 나선다. 물론 조정국은 완벽하게 전지전능한 존재는 아니라서 인간의 머리속에서 직접 생각을 바꾸지는 못한다. 맷 데이먼은 에밀리 블런트와의 사랑을 이루어지지 못하게 하려는 조정국 요원들이 집요한 방해를 벗어나고자 투쟁한다. 두 사람이 사랑에 빠지면 이들은 각자 평범한 사람이 되지만, 만약 헤어지면 맷 데이먼

신경과학자의 입장에서 보면 자유의지라는 것은 없다고 보는 것이 타당하다고 한다. 감정이나 의식이라는 것은 결국 수많은 뉴런의 전기적 발화 및 신경전달물질의 작용 속에서 생겨나는 것이고, 자유의지란 결국 이것들의 작용에 의해서 존재한다고 믿어지는 것에 불과할지 모르겠다. 이 문제에 대해서는 샘 해리스의 책 <자유 의지는 없다>를 통해서 나중에 확인해 보고자 한다. 나는 일단 자유 의지라는 것이 있고, 이에 따라서 행동하는 것이 더 인간적이라는(다른 동물보다 낫다는 자만심?) 전제조건 하에 오늘의 블로깅을 하는 것이다.

영화 <컨트롤러>는 넷플릭스에서 본 것이다. 넷플릭스의 접속 계정은 하나이지만, 가족들이 제각기 프로파일을 따로 운영할 수 있다. 내가 '우리집'이라는 프로파일 하에서 주로 골라서 보는 영화는 드라마와 서정적이고 잔잔한 것들 위주이다. 이러한 취향에 따라서 자동으로 추천된 영화가 목록에 드러나게 되고, 이 중에서 하나를 골라서 보면 대체로 만족도가 높다. 수많은 영화 중에서 마음에 드는 것을 고르는 번거로운 작업을 넷플릭스가 대신해 주고 있는 것이다. 즉 내 '자유 의지'에 따라서 해야 하는 선택 작업의 수고를 덜어주는 셈이다.

넷플릭스의 영화 추천 알고리즘은 통계와 머신러닝에 의한 것으로서 만족도가 매우 높은 것으로 잘 알려져 있다(블로터 2016년 기사). 그런데 갑자기 이런 생각이 들기 시작하였다. 내가 볼 영화 한편도 내가 맘대로 고르지 못한단 말인가? 넷플릭스가 자동으로 추천해 주는 영화를 택함으로서 남은 시간에 내가 더 가치있는 일을 할 것이라고 착각할 것인가?

인간의 삶에서는 유전인자처럼 결정론적인 요소가 크게 작용하는 것은 사실이다(유전인자가 항상 100% 투명하게 발현되는 것은 아니지만). 그러나 다음 세대로 전달되는 유전자 세트에는 필수적으로 변이가 동반됨은 물론, 환경으로부터는 도저히 제어 불가능한 무작위적인 요인이 제공되기 마련이다. 결정론적 요인으로만 인간의 삶이 이루어진다면 발전과 변화가 있을 수 없다. 이른바 '난수 생성기'와 같은 것이 필요하다는 뜻이다. 어떤 수가 나올지는 전혀 알 수 없지만, 난수 생성기를 도입한다는 것은 나의 의지니까 말이다.

이러한 의도적인 반란의 시작으로서 도서관에서 드디어 소설책을 한두권씩 빌리기 시작하였다. 맨날 보던 기술비평·사회과학·경제 관련 책 일변도의 독서에서 벗어나기 위해서이다. 작은 시도에서 큰 변화가 일어나기를 기대해 본다.