Enrichr (gene set enrichment analysis) Start.

BioinformaticsAndMe




생물정보학 분석에서 Functional characterization은 실험한 유전자들의

생물학적 기능을 파악하고 분류하는데, 매우 중요한 과정이다.

#Functional characterization은 2가지 방법이 있다.

1) DEGs와 그 나머지를 비교하여 overrepresented function을 찾는 방법

2) Gene Set Enrichment Analysis로 발현량 차이 값(Fold change)을 고려하여 ranking 하는 방법.



사실 유전자들의 Function을 이해하고 그룹핑하는 일은 기존에 만들어진 DB 정보들을 이용하는 것이다.

많은 enrichment analysis 분석을 제공하는 사이트와 툴들이 있지만,


#Enrichr 를 소개하는 가장 큰 이유는 3가지다.

a) 방대한 DB 정보

- 현재 Enrichr는 132개의 gene set library 에서 245,575개의 annotated gene sets을 보유하고 있다. 

b) 쉬운 접근

- Enrichr 웹사이트에서 유전자 혹 유전자-스코어 정보를 인풋으로 복사 붙여넣으면 분석할 수 있다.

c) 명료한 시각화

- 분석 결과를 보면 다양한 enrichment analysis 결과를 한눈에 쉽게 볼 수 있다.


아래는 Enrichr 홈페이지다.

#Enrichr 홈페이지

http://amp.pharm.mssm.edu/Enrichr/




#아래는 Enrichr 논문에서 발췌한 테이블로 많은 DB 정보들을 라이브러리로 활용 중인 것을 알 수 있다.

#현재는 더 많은 정보를 Enrichment analysis를 위해 활용 중이다.

#흥미로운 점은 각각의 정보를 다운 받을 수 있다는 사실이다 (카레고리별로 정리가 잘 되어 있다).




#Enrichr에서 제공하는 예제 유전자들로 Enrichment 분석을 해보자.


1. 예제 유전자 입력하고, SUBMIT 하기




2. Pathway 결과 확인

-상단부에 'Transcription', 'Pathways', 'Ontologies' 등등 큰 카테고리로 분류되어 있는 것이 보인다.

-'Pathway'를 클릭하면, 우리가 예제 인풋으로 넣은 375개의 유전자가 Enrichment한 pathway들을 DB별로 확인할 수 있다.

-물론, 각각의 정보들을 클릭하면 더 자세한 내용을 확인할 수 있다.




3. KEGG 2016의 테이블 결과 확인하기

- 'KEGG 2016'을 클릭하면 상단에 'Bar Graph', 'Table', 'Network' 등의 자세한 정보를 확인할 수 있다.




직접 Enrichr 홈페이지에 들어가서 이것저것 눌러보고, 모른다면 FAQ를 살펴보는 것이 이해하기 쉽다.

사실 개인적으로 중요한 점은 Enrichr가 제공하는 여러 정보들 중에서 본인에게 적합한 Enrichment 결과를 선택하는 것이겠다.


#또한 Enrichr는 R package 제공되는데, 필요한 분들이 있을 것 같아 참조한다.

https://cran.r-project.org/web/packages/enrichR/vignettes/enrichR.html




마무리하며..

Enrichr에서 사용하는 DB가 항상 최신은 아니다. 위에서 다룬 KEGG DB는 2016 버전이었다.

GO는 2018년으로 업데이트 된 것으로 보이는데, 사용하는 연구자가 어느정도 고려해야할 부분으로 보인다.

모든 DB를 최신으로 이용하고 싶다면, 아마 위에서 소개한 R을 활용하는 것도 방법이 되겠다.




Enrichr (gene set enrichment analysis) End.

BioinformaticsAndMe


+ Recent posts