Machine Leaning & Genomics Start.

BioinformaticsAndMe


#Machine Learning 정의
- 기계학습. 인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 알고리즘과 기술을 개발하는 분야.
- “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure Pif its performance at tasks in T, as measured by P, improves with experience E” – T.Michell(1997)
- "작업 T에 대해 기준 P로 측정한 성능경험 E로 인해 향상됐다면, 그 프로그램은 작업 T에 대해 기준 P의 관점에서 경험 E로부터 "배웠다"라고 말한다.


# Genomics 정의

유전체학. 특정 생물체의 개별 유전자들의 총합인 유전체 및 관련 정보를 체계적으로 연구하는 학문.

- 2003년, 인간이 지닌 모든 DNA를 분석하려했던 인간 지놈 프로젝트(Human Genome Project, HGP)에 의해 Genomics 의 중요성 전파.




# 기계학습과 유전체학

- Genomics에서는 차세대 유전체 분석 기술 (NGS; next generation sequencing technology)의 급격한 발전으로 방대한 유전체 데이터가 생산 중.

- 이를 기반으로 개인 유전체 정보의 맞춤 정밀의학 (precision medicine)를 추구.

- 유전체 빅데이터에 머신러닝 기법 접목은 복잡한 인간의 유전체 정보를 종합적으로 해석할 수 있는 미래 산업의 동력.

- 머신러닝을 이용하여 암, 치매, 비만 등 다양한 질병들의 예방, 조기진단 및 효과적인 맞춤치료가 가능,



- 현재 NGS 분석은 100 만원 이하(앞으로 더 내릴 듯.)의 저렴한 비용으로 진행.

- 미국 배우 안젤리나 졸리는 유방암에 취약한 BRCA 유전자 변이 보유를 확인한 뒤, 유방절제 시행.

- 앞으로 머신러닝이 본격적으로 유전체 데이터와 접목되어, 유전체와 질병과의 연관성이 더욱 많이 발굴될 것이라 예상.

- 아래는 Genomics 분야에서 머신러닝을 어떤식으로 사용하는지 참고할만한 논문들이다.






# 또한, 아래 논문은 머신러닝과 유전체학 관계의 기본지침서 같이 소개되어지는 논문이다.

위 논문 내용 중 몇가지를 정리해보면,

- 머신러닝 알고리즘은 여러 유전체 분석(microarray, RNA-seq, DNase-seq, ChIP-seq)에서 만들어진 Genomic data를 사용할 수 있다.


- 머신러닝 프로그램들이 유전자의 기능을 annotation 하는 데 광범위하게 사용 중 (Gene ontology term assignment).


- 네트워크 모델을 tanning하여 세포의 유전자 발현을 모델링.


- 현재, Genomics에서 머신러닝과 통계기법의 경계는 모호하여 적절히 융합되어 사용 중.






Machine Leaning & Genomics End.

BioinformaticsAndMe

+ Recent posts