한국형 AI의사 '닥터 앤서' 정부 개발 추친 Start.

BioinformaticsAndMe


18년 4월 30일, 서울아산병원서 AI기반 정밀의료 솔루션 출범식이 개최되었다.

정부에서 3년간 357억 원 투입하며, 서울아산병원의 총괄하에 25개 의료기관, 19개 기업 공동개발에 참여한다.


닥터 앤서 (Dr. Answer) 란?

◦ 의료 빅데이터를 통해 의사의 진단·치료를 지원해주며 무엇이든 다 대답해주는 AI닥터.

◦ Dr. Answer(Ai, network, software, er)

◦ 인공지능이 의료 빅데이터를 활용하여 진단·치료에 대한 답을 준다는 의미



□ ‘닥터 앤서’는 다양한 의료데이터(진단정보, 의료영상, 유전체정보, 생활패턴 등)를 연계·분석하여 개인 특성에 맞는 질병 예측·진단·치료 지원.


ㅇ 3년간('18~'20) 총 357억 원(‘18년 50억 원)을 투입하여 AI의료데이터 통합·연계 기술뿐만 아니라, 8개 질환(방암, 대장암, 전립선암, 심뇌혈관질환, 심장질환, 뇌전증, 치매, 소아희귀난치성유전질환) 21개의 국민 체감형 인공지능 의료 소프트웨어(SW)를 개발할 예정.

①병원별 다양한 의료정보(EMR*영상*유전체)를 학습 가능한 빅데이터로 생성·통합·분석을 위한 모듈(데이터레이블, 데이터 관리, AI학습 등) 구축.

②8개 질환의 단계별(예측(예방), 분석·진단, 치료, 예후관리) 인공지능(빅데이터 분석, 정보검색, 상태 모니터링 등) SW 개발.

③수술·교육훈련 및 심리·재활 치료 등에 활용 가능한 의료 데이터 통합 시각화 SW 개발 등을 추진.


ㅇ 학습데이터로 활용할 병원 데이터는 병원별 임상시험심사위원회 (IRB : Institutional Review Board) 심의를 통해 개인정보에 대한 엄격한 비식별 조치를 수행하고, 데이터 수집 분석 활용 폐기 각 단계별로 보안체계를 적용할 예정.


□ ‘닥터 앤서’ 개발에는 본 사업의 총괄주관병원인 서울아산병원을 비롯하여, 수도권 및 권역별 거점 병원 등 총 25개 의료기관과 뷰노, 제이엘케이인스펙션, 카카오브레인 등 19개의 ICT·SW기업이 참여.


ㅇ 국내 최초로 클라우드 기반으로 개발 중인 정밀의료 병원정보시스템(P-HIS)과 연계하여 한국형 정밀의료 서비스를 제공할 예정이며, 의료SW 신시장 창출과 지역 간 의료서비스 격차 해소는 물론 더 나아가 대 국민 의료비 절감의 해법을 제시할 것으로 기대.



□ 한편, 본 사업은 한국형 정밀의료 시장의 성장을 가속화하기 위하여 1차년도(‘18년) 3개 이상 질환의 시제품 개발을 착수하고, 2차년도(’19년)부터는 국민 체감형 서비스를 제공할 수 있도록 테스팅 계획.


ㅇ 국내 인공지능 헬스케어 시장 연평균 성장률은 세계시장보다 높은 70.4%(2015년 17.9억원→2020년 256.4억원)를 보이고 있어 이번 사업을 통해, 新시장 창출 및 미래 먹거리 확보에 추진력을 얻을 수 있을 것으로 보임.


□ 이와 관련하여 서울아산병원 김종재 사업추진단장은 “동일질환이라도 개인의 건강상태, 생활습관, 유전체정보 등에 따라 증상이 다르므로 이 프로젝트를 통하여 한국형 정밀의료의 해법을 찾고 개인 맞춤형 의료시대를 열어갈 것” 이라고 의지를 표명.


□ 과기정통부 김용수 차관은 “한국형 정밀의료의 새 지형을 그릴 수 있는 메디컬드림팀이 탄생했다.”라며,

ㅇ “미래형 먹거리인 의료 산업의 혁신뿐만 아니라 국민건강증진을 위해 ‘닥터 앤서’의 성공적 개발에 지원을 아끼지 않을 것이며, 국내 유수한 병원과 기업이 힘을 한데 모은 만큼 지능형 SW기술 개발은 물론 의료 정보통신기술(ICT)산업계의 선순환 생태계가 구축되기를 바란다.”라고 밝혔다.




한국형 AI의사 '닥터 앤서' 정부 개발 추친 End.

BioinformaticsAndMe

Permutation test (순열검정법) Start.

BioinformaticsAndMe


Permutation test 는 t-test 등의 일반적인 통계 검정을 수행할 만큼 샘플의 수가 크지 않은 경우에 사용할 수 있는 검정 방법. 이 경우 주어진 샘플을 무작위로 추출하여 인공적으로 샘플 숫자를 늘림으로써 전체 모수를 통계 검정이 가능한 크기만큼 키운 다음, 원래 주어진 샘플의 통계 값(ex. 평균, 분산 등)이 전체 모수와 비교하여 얼마나 유의하게 차이 나는지를 검정하는 방법이다.



#‘저체중아의 산모’ vs ‘저체중아x의 산모’ 의 체중 차이를 Permutation test 해보자


1. birthwt 데이터 로딩
source("https://bioconductor.org/biocLite.R")
biocLite("MASS") #MASS package에 있는 birthwt 데이터셋을 사용하려함
library(MASS)
data(birthwt)
View(birthwt)


2. 정상군과 실험군 분류

normal = birthwt[birthwt[,"low"]==0, "lwt"]

normal

case = birthwt[birthwt[,"low"]==1, "lwt"]

case

t.test(normal, case)


3. 두 그룹의 산모 체중에 대한 t 검정 값

real_test = t.test(normal, case)$statistic 

real_test


4. 두 그룹간의 permutation test

permfunc.R

source("permfunc.R") #첨부파일 다운하여 실행

tperm = perm.test(normal, case, n.perm=1000) #1000번 Permutation을 통해 1000개의 t value 생성

hist(tperm)

abline(v=abs(real_test), lty=2, col=2) #실제 t value 가 분포의 극단치에서 보임 (우연이 아닐 것이라고 예상)

5. Empirical p value

pvalue = mean(abs(tperm) >= abs(real_test))  #위 그래프에서 Red 점선 오른쪽에 있는 개수들의 평균을 구함

pvalue

[1] 0.011

따라서, 계산된 Emprical p-value는 0.011로 '저체중아 출산과 산모의 체중은 관련성이 있다' 라고 결론 내릴 수 있다.


# 위 내용은 BITEC (Biomedical Informatics Training and Education Center) 교육내용을 참고하였다.


6. 실습 Example (위와 같은 맥락이지만, 연습삼아 해보셔도 좋을듯하다)

1) make up some ‘true’ data

carrier <- rep(c(0,1), c(100,200))

null.y <- rnorm(300)

alt.y <- rnorm(300, mean=carrier/2)

2) t-test

t.test(null.y~carrier, var.equal=TRUE)

t.test(alt.y~carrier, var.equal=TRUE)

3) permutation test

null.diff <- mean(null.y[carrier==1])-mean(null.y[carrier==0])
alt.diff <- mean(alt.y[carrier==1])-mean(alt.y[carrier==0])
one.test <- function(x,y) {
  xstar<-sample(x)
  mean(y[xstar==1])-mean(y[xstar==0])
}
many.truenull <- replicate(1000, one.test(carrier, null.y))
many.falsenull <- replicate(1000, one.test(carrier, alt.y))
4) 귀무가설 채택
hist(many.truenull)
abline(v=null.diff, lwd=2, col="purple")
mean(abs(many.truenull) > abs(null.diff))

5) 귀무가설 기각
hist(many.falsenull)
abline(v=alt.diff, lwd=2, col="purple")
mean(abs(many.falsenull) > abs(alt.diff))



마무리하며..

Permutation test 에 대한 간단한 R 예제를 살펴보았다.

통계검정 하려는 샘플 수가 적을 때 사용할 수 있는 기법이라는 점이 핵심으로 보인다.




Permutation test (순열검정법) End.

BioinformaticsAndMe

'R' 카테고리의 다른 글

R, Command line interface Ⅱ  (0) 2018.07.20
R, Command line interface Ⅰ  (0) 2018.07.16
R, RStudio 설치  (0) 2018.07.14
Cogena-2 (CoExpression 분석)  (0) 2018.07.06
Cogena-1 (CoExpression 분석)  (0) 2018.07.05

Nebula Genomics (네불라 지노믹스) Start.

BioinformaticsAndMe




Sell Your DNA for Coins with Nebula Genomics

너의 DNA를 팔아라!

오늘 이야기할 회사는 최근 핫한 블록체인 기술로 사람 유전 정보의 가치를 창출(산출?)하려는

'Nebula Genomics (네불라 지노믹스)' 다.



소개에 앞서,

아래는 기존의 DTC (Direct-to-consumer) 회사(가운데)들이 개개인들의 유전 정보를 수집하여 수익을 냈던 사업 모델이다.

예를 들어,

개인이 '23andMe' 회사에 유전자검사를 의뢰하고 돈을 내고,

제약회사가 '23andMe' 가 모은 데이터베이스에 접근하여 돈을 내는 시스템인거다

(화이자, 제넨탁과 같은 대형 파마들이 23andMe의 데이터를 비싸게 주고 샀다고 한다. 얼마징..)

(참고로, 구글이 23andMe에 공격적인(적극적인) 투자를 진행하여 인수했다.. 역시 갓글..)


위에 사업모델을 보고 Nebula Genomics 는 생각했다.

저기 중간에 있는 Personal genomics company 필요없어 보이는데?..! (도매상을 건너뛰자)

이 생각을 현실화 하려면 개인 유전정보 관리 문제가 이제까지의 관건이었지만,

블록체인 기술로 개인 유전체 정보를 Nubula Token화 하여 개인-업체 간 유전 정보를

가능케 하는게 아래 네불라 지노믹스의 사업모델이다.


#Nebula Genomics 의 특징을 정리해보자.

- 개인의 유전체 데이터를 필요로 하는 구매자가 그 대가를 개인에게 지급하고 개인은 암호화된 유전체 데이터를 안전하게 제공하는 서비스 플랫폼 구축.

- 개인은 유전체 데이터 제공의 대가로 네불라가 발행한 디지털 토큰을 받고, 원한다면 현금화 할 수 있는 방식.

- 이 토큰은 비트코인처럼 거래되지는 않지만 시퀀싱 비용이 낮아짐에 따라 (해가 지날수록 기술이 좋아지므로 시퀀신 비용은 떨어진다) 토큰의 가치도 떨어지거나, 유전체 데이터 구매자가 많이 늘어난다면 토큰가치도 크게 올라갈 것이라 예상.



#네불라 코인 구입 과정을 살펴보자.
1) 개인들은 처음에 Nebula Genomics로부터 토큰을 구입해 유전체를 해독하고 확보.
2) 익명으로 Nebula 네트워크를 통해 본인의 유전체 데이터를 공유하고 회사가 요청하는 설문조사를 마치면, 회사는 개인에게 데이터 가치에 맞는 토큰을 지불하며, 개인은 이 토큰을 현금화할 수 있음.
3) 구매자는 유전체 데이터 가치에 따라 토큰을 차등 지불할 수 있으며, 설문 참여자가 구매자가 간절히 원하는 데이터를 제공한다면 높은 토큰 보상이 지급되며, 그렇지 않다면 낮은 가치의 토큰 보상.


위에 표는 Nebula genomics가 제공하는 타 DTC 회사 비교 표이다.

오. 네불라지노믹스.. 다 이겼어.. (왠지 조만간 다른 회사도 나타나서, 저 표 그리고 다 이긴다고 만들듯..ㅋ)

지금 생각난 것인데, 네불라 지노믹스에는 그 유명한 유전학의 대가 '조지 처치'가 있다. (사실 이 사실만으로도 여럿 떄려 눕히는듯..)



마무리..

Nebula Genomics 의 사업모델은 사실 과정자체는 심플해보인다.

블록체인이라는 우수한 공공장부 기술을 통해 사업을 확장해 나갈수 있어 보인다.

하지만, 걱정인 것이 국내에서 '코인'이라는 개념에 대한 불신이 팽배하기 때문에,

위와 같은 사업모델을 국내에서 실행할 수 있을지는 아직까지 미지수다.

지난 달 말에 'MyData' 사업 계획을 정부에서 발표했는데, 본인의 의료데이터를 해당 기관에서 다운받을 수 있다고한다.

저 사업이 활성화되면서 개인유전데이터 거래가 어떤식으로(네불라코인처럼?) 진행될지 궁금해진다.


네불라 지노믹스 홈페이지

https://www.nebulagenomics.io/




Nebula Genomics (네불라 지노믹스) End.

BioinformaticsAndMe


공통자격

○ 박사학위 취득 후 5년이 경과되지 아니한 자 또는 3개월 내 박사학위 취득 예정자

○ 국가공무원법 제33조(결격사유)에 해당되지 않는 자 및 연구소 규정에 의한 임용결격 사유가 없는 자

○ 남자의 경우 병역의무를 필하였거나 면제된 자

○ 연령․성별 제한없음

○ 취업보호대상자·장애인은 증빙서류 제출 시 관계 법령에 의거 우대

○ 경력단절여성, 여성과학기술인 우대


접수기간 및 문의 

○ 접수기간 : 2018. 7. 5(목) ~ 2018. 7. 20(금) 18:00까지 

○ 신청방법 : 연구소 채용사이트(https://recruit.kitox.re.kr)

○ 전형 및 채용 일정

- (채용공고) 2018. 7. 5.(목) ~ 2018. 7. 20.(금)

- (서류심사) 2018. 7. 31.(화)까지

- (세미나발표 및 면접심사) 2018. 8. 10.(금)까지

- (임용) 2018. 8월 중 

정부 '마이데이터(MyData)' 시범 사업 추진 Start.

BioinformaticsAndMe


대통령직속 4차산업혁명위원회에서 18년 6월 26일, 데이터 산업 활성화 전략 등을 심의․의결하였다.


그중에서 흥미로워 보이는 건

'마이데이터(MyData)' 사업이다.


마이데이터사업이란?

개인정보 관련 법개정 없이도 바로 시행 가능한 데이터 활용체계를 기관 중심에서 정보주체 중심으로 전환해 나간다는 사업


헬스케어산업에서 본다면,

사실 마이데이터 사업이 제대로 되기만 한다면, 의료기관이 주체였던 의료정보를

기업 - 개인 간의 의료정보 교환이 가능해지기 때문에,

국내 헬스케어 시장이 기하급수적으로 성장할 수 있다는 것은 사실이다.

아래 그림을 보면 마이데이터(MyData) 사업을 단번에 이해할 수 있다.



MyData 사업이 시행된 미래... 가 온다면? (상황극)

1. 나는 치질 환자다. 진단부터 치료, 관리까지 3개월 동안 병원을 다녔다.


2. 소중한 치료의 기억을 간직하고 싶었던 나는 병원에 요청하여 그동안의 기록을 내 스마트폰에 저장해두었다.


3. 주말 스마트폰을 보면서 뒹굴고 있는데, 유투브 광고에서 유명 제약사가 치질약을 광고한다.


4. 광고 끝자락에 해당 제약사는 치질치료기록을 (치질환자가 아닌!) 모은다고 한다.


5. 나는 제약사에 전화를 걸었다. 그랬더니 내 치질 치료기록을 남들보다 비싼값에 산다고 한다.


6, 이유를 물어보니 나는 한국인 특이적인 치질이기 때문에 연구가치가 높을 것 같다고 한다.


7. 나는 Call 했다. 나는 받은 돈으로 갖고 싶었던 치질 의자를 샀다. (WIN)


8. 치질치료기록을 모은 제약사는 몇개월동안 충분한 데이터가 쌓였고, 10년이 넘게 걸리던 해당 신약개발을 2년으로 줄일 수 있었다. (WIN)


결과 : WIN - WIN 이다!


위 상황극..ㅠ은 그냥 사업이 시행되면 있을법한 가능성을 예를 든 저의 생각이므로 그냥 웃고 넘어가셔도 된다.



MyData 사업뿐만 아니라, '데이터안심존' 사업도 추진할 예정이란다.

기관 데이터를 비식별화해서 클라우드 기반으로 데이터를 모아두고 각종 기업들이 접근해서 의미있는 결과(산업가치창출..)를

내는 사업으로 보인다. 참고로, 비식별화된 데이터라도 기업들이 가져갈순 없다. (근데, 나는 의문인게 저 비식별화조치라는게 참 애매한 말이다.. 가이드라인이 있긴 있는데,  그 가이드라인을 개인정보보호법이나 생명윤리법 갖다대면 바로 꼬리내리는 것 같다. 사업이 시작되면서 어떤식으로 바뀌게 될지 궁금하다)


다시 처음으로 돌아가서 사실 MyData 사업은 애플, 구글과 같은 미국 슈퍼파워 기업들이 지금 밀고 있는 트렌드다.

또한, 최근 설립한 '네불라 지노믹스'라는 미국 기업은 개인 유전체를 토큰화하여... 음 그냥 더 쉽게 말하면

자기 유전정보를 비트코인 사고 팔듯이 할 수 있는 플랫폼을 구축하려는 것 같다.

놀라운건 조지 처치 (유전 분야에서 엄청 유명하심)가 같이 한다는게 놀랍다.

http://decenter.sedaily.com/NewsView/1RVOC35G08


네불라지노믹스는 다음 칼럼에 다시 소개하겠다.


뭔가 마이데이터 사업 얘기하다가 다른 길로 샌 것 같다.. 아무튼, 취지 자체는 좋은 사업이다. 그러나,, 역시

시민단체에서 폭발적인 반응을 보여주셨다. 규제 개선이 쉽지는 않아 보이는 현 상황이다.

http://www.ingopress.com/news/articleView.html?idxno=21450

사실 우리나라는 의료기록체계가 상당히 잘 잡혀있어서, 기관들이 빅데이터라 불릴만한 거대한 데이터를 보유하고 있다.

연구자의 입장에서 한번쯤은 그런 데이터를 사용해서 훌륭한 결과를 내고 지구 평화에 기여해보고 싶다.

(마무리를 지구 평화로 하다니... 새벽이라 죄송합니다)




정부 '마이데이터(MyData)' 시범 사업 추진 End.

BioinformaticsAndMe



CJ제일제당 채용 홈페이지

http://recruit.cj.net/recruit/ko/recruit/recruit/detail.fo?zz_jo_num=4854

+ Recent posts