Machine Leaning & Genomics Start.
BioinformaticsAndMe
# Genomics 정의
- 유전체학. 특정 생물체의 개별 유전자들의 총합인 유전체 및 관련 정보를 체계적으로 연구하는 학문.
- 2003년, 인간이 지닌 모든 DNA를 분석하려했던 인간 지놈 프로젝트(Human Genome Project, HGP)에 의해 Genomics 의 중요성 전파.
# 기계학습과 유전체학
- Genomics에서는 차세대 유전체 분석 기술 (NGS; next generation sequencing technology)의 급격한 발전으로 방대한 유전체 데이터가 생산 중.
- 이를 기반으로 개인 유전체 정보의 맞춤 정밀의학 (precision medicine)를 추구.
- 유전체 빅데이터에 머신러닝 기법 접목은 복잡한 인간의 유전체 정보를 종합적으로 해석할 수 있는 미래 산업의 동력.
- 머신러닝을 이용하여 암, 치매, 비만 등 다양한 질병들의 예방, 조기진단 및 효과적인 맞춤치료가 가능,
- 현재 NGS 분석은 100 만원 이하(앞으로 더 내릴 듯.)의 저렴한 비용으로 진행.
- 미국 배우 안젤리나 졸리는 유방암에 취약한 BRCA 유전자 변이 보유를 확인한 뒤, 유방절제 시행.
- 앞으로 머신러닝이 본격적으로 유전체 데이터와 접목되어, 유전체와 질병과의 연관성이 더욱 많이 발굴될 것이라 예상.
- 아래는 Genomics 분야에서 머신러닝을 어떤식으로 사용하는지 참고할만한 논문들이다.
# 또한, 아래 논문은 머신러닝과 유전체학 관계의 기본지침서 같이 소개되어지는 논문이다.
위 논문 내용 중 몇가지를 정리해보면,
- 머신러닝 알고리즘은 여러 유전체 분석(microarray, RNA-seq, DNase-seq, ChIP-seq)에서 만들어진 Genomic data를 사용할 수 있다.
- 머신러닝 프로그램들이 유전자의 기능을 annotation 하는 데 광범위하게 사용 중 (Gene ontology term assignment).
- 네트워크 모델을 tanning하여 세포의 유전자 발현을 모델링.
- 현재, Genomics에서 머신러닝과 통계기법의 경계는 모호하여 적절히 융합되어 사용 중.
Machine Leaning & Genomics End.
BioinformaticsAndMe
'Machine Learning' 카테고리의 다른 글
강화 학습(Reinforcement Learning) (0) | 2018.09.15 |
---|---|
비지도 학습(Unsupervised learning) (0) | 2018.09.05 |
지도 학습(Supervised learning) (0) | 2018.08.31 |
Gene Prediction & Machine Learning (1) | 2018.08.05 |
Hidden Markov Model (은닉 마르코프 모델) (2) | 2018.08.05 |