Gene Fusion (유전자융합) Start.
BioinformaticsAndMe
1. Gene Fusion 이란?
- 복수의 다른 유전자가 재조합 등에 의해 융합단백질을 코드하게 되는 것
- Fusion gene: 유전체에 별개로 존재하는 두 유전자가 융합돼 하나로 동작하는 유전자
- 삽입(Insertion), 결실(Deletion), 전좌(Translocation), 역위(Inversion) 등 염색체의 구조적 이상으로 인하여 발생
- BCR-ABL fusion: 전좌로 두 유전자가 융합 → 만성골수성백혈병(CML)을 유발.
- 아래 그림처럼 유전자 DNA의 어떤 부위가 결합하냐에 따라 Fusion Effect는 달라질 것이다.
- 첫번째를 보면, DNA fusion으로 5` promoter의 강렬한 자극?을 받아 빨강이 protein이 급격히 늘어났다 (Deregulation 상태).
- 나머지 부분은 키메라 단백질이 만들어질 수도, 단백질 기능을 잃을 수 있다는 예이다.
2. Fusion gene 기작
- Gene Fusion은 두 가지 mechanism 형태로 발생한다.
(A) 구조적 재배열
전좌, 역위, 결손, 삽입과 같은 염색체 구조 재배치로 Gene Fusion을 형성한다. Hybrid된 gene은 센트럴 도그마(DNA->RNA->PROTEIN) 진행.
(B) 비구조적 재배열
인접한 유전자의 번역초과(readthrough) 또는 mRNA 사이의 스플라이싱(Trans-, Cis-)으로 Fusion Transcript가 형성된다.
- Gene Fusion의 주요 메카니즘은 (B)비구조적 재배열이라 알려져 있다.
3. Fusion에 의한 생물학적 특징
- 체내에서 Fusion의 생물학적 특징을 살펴보자.
(A) Gene fusion 현상은 Cancer에세 매우 다양한 형태로 발생한다.
(B) 대부분 Fusion gene들은 단지 몇몇개의 파트너 유전자와 융합하고, 암종에 따라 다양한 Fusion Network를 갖는다.
(C) 암에서 Fusion의 빈도가 적을때도, 많을때도 있다. Fusion의 빈도는 체세포변이(somatic mutation) 빈도에 반비례한다.
- 특정 유전자의 Fusion 빈도와 Somatic mutation 빈도가 anti-correlation이라는 점이 흥미롭다, 체세포변이가 많은 유전자는 Fusion이 적게 일어난다.
- 위에 체세포변이 관련 내용은 모든 암종 및 연구환경에서 anti-correlation 관계가 형성된다고 확신할수는 없다. 참고정도로 해두면 좋을듯 하다.
4. Fusion gene의 구조적 특징
- Fusion gene의 구조적 특징을 살펴보자.
(A) Fusion gene의 Breakpoint가 in-frame에 생기는 경향이 있어 구조 자체를 잘 보존하려고 한다.
(B) Fusion gene 자체가 domain이 몇개밖에 없지만, Fusion transcript에서는 평균보다 더많은 domain을 encoding한다.
(C) Fusion protein에서는 기존에 없던 domain recombination이 보인다.
(D) Fusion protein 구조에서의 무질서가 증가할수록 다양한 domain들의 interaction을 촉진한다.
5. Fusion gene의 발현 패턴
- Fusion gene의 발현 패턴을 살펴보자.
(A) Fusion gene의 Parent gene들은 유전자 발현이 높은 편인데, Fusion gene은 발현이 낮고, 조직특이적(tissue-specific)하다.
(B) 5` 쪽의 active promoter와 3` 쪽의 안정적인 3UTR이 페어링하면 Fusion이 아주 잘 일어날 것이다.
(C) Fusion transcript에서 실제로 protein으로 translation되는 경우가 매우 희귀하다 (대부분의 fusion이 false positive일 가능성).
(D) Cancer 관련된 Fusion이 정상세포에서 발견된다.
- NGS에서 Fusion 찾는 알고리즘이 굉장히 많은데, 위에 언급한 False positive를 최대한으로 줄여야 실제로 의미있는 Fusion gene을 찾을 수 있겠다.
6. Fusion Gene tool
- 아래는 RNAseq으로 Fusion을 찾는 대표 NGS Tool이 되겠다.
- Group에 있는 표현은 해당 툴에 적용 가능한 데이터와 알고리즘 설명이다.
- fastq 데이터가 single-end, paired-end 인지? Alignment에서 리드를 조각내는 과정이 있는지? 등
- 구체적인 방법은 'Bioinformatics Tool' 칼럼에서 다시 다룰 예정이다.
#아래 논문을 참고하였다.
1)Latysheva, N. S., & Babu, M. M. (2016). Discovering and understanding oncogenic gene fusions through data intensive computational approaches. Nucleic acids research, 44(10), 4487-4503.
2)Kumar, S., Vo, A. D., Qin, F., & Li, H. (2016). Comparative assessment of methods for the fusion transcripts detection from RNA-Seq data. Scientific reports, 6, 21597.
Gene Fusion (유전자융합) End.
BioinformaticsAndMe
'Biology' 카테고리의 다른 글
박테리아 성장곡선 (Bacterial growth curve) (0) | 2019.09.21 |
---|---|
항체 (Antibody) (0) | 2018.09.16 |
비교유전체학 (Comparative genomics) (0) | 2018.09.07 |
Genome Evolution (유전체진화) (0) | 2018.08.24 |
Evolution theory (진화론) (0) | 2018.08.03 |