GWASdb (SNP annotation database) Start.

BioinformaticsAndMe






오늘은 쓸만한 GWAS SNP annotation 데이터베이스를 살펴보겠다.


GWASdb


GWASdb는 SNP Annoation 정보를 가진 거의 모든 Public db를 Curation했다 (아래 Table 참고).

GWASdb에서 Annotation된 SNP을 TASs(traits/diseases associated SNP) 라고 하는데, 수집에 사용한 기준이 다소 흥미롭다.

일반적으로 GWAS SNP p value 기준을 '5 x 10-8' 으로 잡고 결과를 리포팅하는데, GWASdb에서는 '1 x 10-3' 까지의 SNP들을 수집했다.

이것은 Phenotype에 연관된 SNP들의 N수를 광범위하게 늘려나가면서, 관련 GWAS 연구를 촉진시키기 위함이란다.


 SNP information Gene-based annotation Knowledge-based annotation Functional prediction Evolution annotation Disease annotation External link 
Annotations Manually curated (250k), dbSNP 142, 1000G phase I, HapMap and 1000G LD RefGene, EnsembleGene, KnownGene, GENCODE, Small RNA, MicroRNA target sites Validated and predicted enhancer, Insulator, HapMap and GTEx eQTL, Long range interaction (5C, ChIA-PET, Hi-C), ENCODE ChIP-seq, ENCODE functional elements Transcriptional factor binding site affinity, MicroRNA target site affinity, Splicing site affinity, Non-synonymous SNP functional prediction, Synonymous SNP functional prediction, Phosphorylation site functional prediction Positive selection, Conserved functional RNA, PhastCons, GERP++ elements OMIM, ClinVar, Cosmic, DGV, GAD SNPedia, Regulomedb, HaploReg, rSNPBase, UCSC Genome Browser, GWAS central 




그래서 총 수집한 TASs가 몇개인지 아래 bargraph에서 보인다.

Genic region에만 14만개 정도가 있으며, Intergenic까지 합치면 대략 25만개 TASs가 있다.







#GWASdb는 2011년, 처음으로 Nucleic Acids Research에 Publish했으며....



그 업데이트 버전(v2)를 2015년에 재차 publish 하였다.

(안타까운 점은 위 버전을 마지막으로, 16년부터는 지속적 업데이트는 없는 것으로 보인다)





개인적으로 생각하기에 GWASdb에서 가장 효율적으로 활용할 수 있는 정보는

Disease SNP 카테고리다.



예를 들어. 알츠하이머로 Curation된 모든 SNP 리스트를 보고 싶다면 쉽게 ctrl+F로 검색하여 찾을 수 있다.




마무리하며..

GWASdb는 현재 'GWASdb 2015 AUGUST release'가 마지막 버전이다.

아래 링크건 홈페이지에 'Services' 항목으로 가면 다운받을 수 있다.

흥미로운 점은 Drug 관련된 SNP 정보들도 정리해놨기 떄문에,

특정 약물에 관련된 TASs 리스트를 확인해볼 수 있겠다.




#GWASdb 홈페이지

http://147.8.193.36/gwasdb





GWASdb (SNP annotation database) End.

BioinformaticsAndMe

+ Recent posts