[NGS QC] MultiQC Start.

BioinformaticsAndMe





NGS 분석을 이것저것 하다 보면, 결과들이 쌓이고 일일이 Quality Control하기 귀찮아진다.

또한, 샘플까지 많다면 첩첩산중이다.. 이때 찾아낸 QC tool이 있었으니,


2016년 6월 bioinformatics 저널에 이름을 알린 'MultiQC' 이다.

Citation도 이미 100을 넘은 것을 보아, 많은 생물정보학 연구자들이 사용하고 있는 추세로 보인다.



#이 툴은 NGS 분석과정에서 나오는 QC 결과들을 아래처럼 한장의 report로 만들어준다.



위 그림의 상단 메뉴바를 본다면, RNA-Seq에서부터 Hi-C 등 다양한 NGS 분석 QC를 지원한다.


한가지 착각할 수가 있는데, MultiQC가 모든 QC 분석을 진행하는 것은 아니고, 여러 툴에서 돌린 QC 결과를 종합해주는 것이다.

예를 들어, 왼쪽바에서 STAR, Cutadapt, FastQC를 볼수 있는데,

저 3개의 툴을 돌리고 나온 결과 로그값을 스캔하여 모든 샘플의 QC정보를 제공한다.





#단언컨대, NGS 분석을 하는 연구자라면 지금 소개하는 ‘MultiQC’ 를 강력하게 추천한다.

이렇게 강력강력하게 추천하는 이유는 직접 사용해보고 느낀 아래 3가지 이유 때문이다.


1. 일단 사용하기 굉장히 쉽다.


2. 샘플이 많거나 여러 분석이 진행됐다면, 쉽게 결과들을 종합해준다.


3. 리포트 파일이 깔끔하며, 리포트 화면에서 세세한 수정이 가능하다.


 


#또한 MultiQC는 NGS 연구자들이 흔하게 사용하는 대부분의 프로그램들을 지원한다.

본인이 사용하는 분석툴이 MultiQC에서 지원하지 않는다면, 개발자에게 요청하는 방법이 있겠다.

그러나, 나라면 내가 가진 툴에서 나오는 로그값들을 위 표에서 지원하는 다른 툴의 로그값 형태로 변환시키는 스크립트를 짤 것이다.

 




#MultiQC 설치

MultiQC 설치는 매우 간단하다.

아래 그림 우측하단에 나와 있듯이, pip으로 간단하게 설치할 수 있다.

MultiQC는 python으로 만들어졌다. 

#github을 이용할 수도 있다.

git clone https://github.com/ewels/MultiQC.git

cd MultiQC

python setup.py install


 


#MultiQC가 진행되는 과정은 3단계로 요약 가능하다.

1) 특정 디렉터리에서 분석 결과의 로그 파일을 검색.


2) 로그파일의 통계를 요약하여 한장의 HTML 보고서를 생성.


3) MultiQC 보고서 내의 결과 그림들 확인 및 export.


정말 간단하게 실행하려면 특정 폴더(data)에 모든 NGS 분석결과를 모아둔 뒤에,

$ multiqc data/

를 실행하면 NGS 결과 로그들을 스캔하면서 자동적으로 MultiQC결과 리포트를 생성해준다.



 

#물론, 원하는 폴더나 파일들만을 '*(asterisk)'를 이용해 스캔할 수 있다.

#Choosing where to scan

multiqc data/

multiqc data/ ../proj_one/analysis/ /tmp/results

multiqc data/*_fastqc.zip

multiqc data/sample_1*


#원하지 않는 파일은 '-x/--ignore flag'를 이용해 거른다.

# -x/--ignore flag

multiqc . --ignore *_R2*

multiqc . --ignore run_two/

multiqc . --ignore */run_three/*/fastqc/*_R2.zip





#RNA-seq QC 결과 예제

http://multiqc.info/examples/rna-seq/multiqc_report.html


- 위 그림은 전체적인 QC 값들의 통계를 보여준다.


- 위 그림은 Alignment stat 결과


- 우리에게 익숙한 FASTQC 'Per Base Sequence Quality' 결과





#multiQC 홈페이지

http://multiqc.info/



[NGS QC] MultiQC End.

BioinformaticsAndMe



'Bioinformatics Tool' 카테고리의 다른 글

[BLAST] BLAST result  (0) 2018.11.26
[NGS Fusion] Fusion Tools  (0) 2018.09.09
[Cytoscape] GeneMANIA 1  (0) 2018.07.22
[Driver Annotation] iCAGES  (0) 2018.07.13
[CNV] ONCOCNV  (0) 2018.07.08

+ Recent posts