Cloud Drug discovery Start.

BioinformaticsAndMe




오늘은 Computer-aided drug discovery(CADD) 분야에서 'Cloud Computing'의 잠재력을 살펴보겠다.



1. 컴퓨터를 활용한 신약 개발 (CADD)

클라우드 컴퓨터를 논하기 전에 먼저 CADD에 대한 설명이 필요할 것 같다 (아래 참조).

http://bioinformaticsandme.tistory.com/26?category=808221



컴퓨터 성능의 비약적인 발달에 따라, 많은 제약회사들이 CADD를 통해 신약을 개발하기위해 각축을 벌였다.

영국의 제약회사 글락소웰컴은 Relenza(리렌자)라는 흡입식 독감 전문 치료제를 CADD를 활용해 창출하였다.

#리렌자: 독감 바이러스 표면에 있는 바이러스 증식 효소 neuraminidase를 억제함으로써 바이러스가 다른 세포로 확산되는 것을 저해.

#뉴라미니다아제를 표적으로 수많은 단백질의 표적 구조를 탐색연구하는데 CADD를 활용.




#Drug discovery 연구에서 컴퓨터를 활용한 가상 스크리닝 과정을 심플하게 살펴보자.

1) 타겟사이트를 찾음

2) 찾은 것을 3D 모델링.

3) 수많은 candidate을 docking해봄.

4) 얼마나 잘 결합하는지 측정.

5) 가장 유망한 candidate을 physical screening 코스로 넘김.


위 일련의 과정 중에서 성공적인 신약 개발에 필수적인 요소가 무엇일까? 아래 2가지를 키포인트로 두고싶다.

- 데이터(Ex: compound data)를 얼마냐 확보하고 있는가?

- compound 하나당 얼마나 빠른 속도로 정확하게 처리될 수 있는가?


다시 말해, candidate으로 활용할 대용량 데이터들을 얼마나 빠르고 정확하게 처리할 수 있는지

컴퓨터를 활용한 신약 개발의 성공을 결정지을 것이다.





2. 클라우딩 컴퓨터 (Cloud computing)

클라우드 컴퓨팅은 인터넷을 통해 유저가 필요한만큼의 리소스를 가져다 사용하며, 유연성 있게 작업 환경을 구축할 수 있다.




CADD 연구를 위해 방대한 computer cluster를 로컬 환경에 직접 구축하는 것은 생각보다 긴 시간을 소모한다.

서버컴퓨터를 사고, 모델링 소프트웨어를 사고, 필요 인력을 고용하는 등

제대로 된 CADD 분석 환경을 구축하려면 넉넉잡아 3년이 걸린다한다. 


신약개발 앞단의 연구가 물론 중요하지만(garbage-in, garbage-out),

그 앞단 연구를 위해 방대한 시스템을 구축하는 시간과 비용 또한 무시할 수 없을 것이다.

기껏 시간과 돈을 들여 CADD 분석 환경을 구축했는데, 이렇다할 성과가 안나와 사업을 접게 된다면,

힘들게 구축한 서버 클러스터와 각종 비싼 라이센스가 큰 부담으로 남을 것이다.




신약개발의 주요 포인트는 대용량 데이터와 빠른 프로세싱이기 떄문에,

손쉽게 그러한 환경을 구축할 수 있는 클라우드 컴퓨팅이 CADD 연구에 기반이 될 수 있다.


클라우드의 대용랑 Storage와 빠른 분산처리 시스템은 신약개발,

특히 CADD 연구 기간을 비약적으로 단축할 것이다. 예를 들어,

1개의 cpu로 100시간 걸리는 일은 클라우드로 손쉽게 100개의 cpu로 늘려 1시간만에 끝낸다면 어떨 것인가?





3. AutoDock

CADD 연구에서 가장 많이 활용되는 도팅 패키지 'AutoDock'을 예로 들어보겠다.

#AutoDock: 신약개발을 위한 Molecular docking, virtual screening을 오픈소스 형태로 제공


#AutoDock을 이용한 신약개발 예제

- 도킹 알고리즘을 이용해 하나의 도킹을 계산하는데 평균적 20분 정도가 소요되고, 30만개 화합물을 대상으로 하면 39년 정도의 시간이 소요.

- 사용되는 데이터는 단백질(400KB), 화합물(3KB) 등이 있는데, 30만개를 기준으로 1GB정도의 저장 공간이 필요.


아래 논문을 참고하면 AutoDock에 고속처리기법을 적용해 SARS(중증 급성 호흡기 증후군) 대규모 신약후보물질탐색을 수행하였으며,

컴퓨팅 자원을 활용하여 110만개의 화합물을 대상으로 평균 2500개의 CPU를 동시 활용하여 실험을 하였고,

총 42년의 계산을 11일만에 완료했다고 한다.

#참조: 슈퍼컴퓨팅환경에서의 대규모 계산 작업 처리 기술 연구

http://www.dbpia.co.kr/Journal/ArticleDetail/NODE02416799



위 사례를 통해 다시한번 CADD 연구에서 클라우드의 필요성이 분명해진다.

1) candidate 증가에 따른 대용량 Storage

2) 수십년의 계산을 몇일만에 끝낼 수있는 고속처리기법




마무리하며

최근 대규모 제약 및 생명공학 회사 (GSK, pfizer, Eli Lilly & Co, Johnson & Johnson, Genentech)에서

신약개발 과정에서 적극적으로 클라우드 컴퓨팅을 활용하는 것으로 알려져 있다.

또한, 클라우드 선두주자인 아마존과 마이크로소프트 및 뒷따르는 알리바바, 구글의 적극적인 투자 개발로

그 사업영역이 확대되고 있고, 특히 신약개발과 관련한 시장을 앞다투어 개척 중이다.





Cloud Drug discovery End.

BioinformaticsAndMe


'Drug Discovery' 카테고리의 다른 글

CADD(Computer-Aided Drug Design)_v2  (0) 2019.05.21
Ligand 라이브러리 for CADD  (0) 2018.09.05
Ligand 데이터베이스  (0) 2018.09.03
Drug repositioning (신약재창출)  (0) 2018.07.23
CADD (Computer-Aided Drug Design)  (0) 2018.07.15

+ Recent posts