Genome Evolution (유전체진화) Start.

BioinformaticsAndMe






오늘은 Genome Evolution을 설명하기 위한 가설들을 살펴보겠다.

게놈의 진화는 코딩(Coding)논코딩(Noncoding)으로 나누어 설명된다.


#참고로 코딩과 논코딩이 뭔지 모른다면 아래 정도로 이해하면 된다.

ㄱ. Coding region(암호화영역) - 단백질을 만들어내는 아미노산 서열

ㄴ. Noncoding region(비암호화영역) - 코딩 부위 아닌 서열




ㄱ. Coding region의 3가지 가설

1) 기능 중심 가설 (Function-centered hypothesis)

유전자진화에 있어서 가장 중요한 변수가 바로 기능의 중요성이라는 것이다. 이는 분자진화학이 태동한 이래 지난 40여년동안 중심 가설이 되어 왔다. 이 모델에 따르면, 기능이 중요한 유전자들은 진화적으로 선택 압력을 매우 강하게 받음으로 인해, 돌연변이가 생기더라도 당대에 도태시킴으로써 다음 자손에 돌연변이 된 유전자를 전달시키지 않는다. 따라서 기능이 중요한 유전자는 덜 중요한 유전자에 비해 그 진화 속도가 매우 느리게 된다. 


아래 그림은 Essential gene(중요 유전자)들이 Non-essential gene들에 비해 진화율이 낮다는 것을 의미한다.

c 그림의 dn/ds가 낮을수록 진화율이 낮은(보존율이 높은) 것을 의미한다.



2) 발현 중심 가설 (Expression-centered hypothesis)

발현 중심 가설은 기능 중심 가설에 정면으로 도전한다. 유전자의 중요도 보다는, 오히려 유전자의 발현 정도가 진화율을 결정한다고 주장한다. 이는, 대량의 게놈 데이터를 사용한 분석에서 중요도와 진화율 간에 역의 관계가 유의하게 나오지만, 기대만큼 강하게 나오지 않는다는 관찰에 바탕을 두고 있다. 오히려 다양한 생물 종에서 관찰한 결과, 가장 유의한 차이를 보이는 것은 바로 발현 정도(expression abundance)라는 것이다. 이 가설에 의하면, 높은 수준으로 발현되는 유전자는 낮은 수준으로 발현되는 유전자에 비해 최적의 코돈(codon)을 선호하는 경향성을 나타내게 되고, 따라서 코돈의 3번째 위치의 substitution rate이 많이 발현되는 유전자의 경우에 더 느려 진다는 것이다. 뿐만 아니라, Drummond 그룹이 제창한 Mistranslation-induced misfolding (MIM) hypothesis에 의하면, 많이 발현되는 유전자는 mistranslation에 의한 misfolding으로 인해, 자연선택의 압력을 더욱 거세게 받는다. 즉, 많이 발현되는 유전자 일수록 mistranslation에 의한 deleterious effect가 더 심하게 나타날 수 있고, 따라서 이를 막는 residue의 진화율이 낮아진다고 설명한다.




3) 조직 중심 가설 (Tissue-centered hypothesis)

이 가설은, 조직에 따라 발현 되는 유전자의 종류가 달라지고, 따라서 진화율이 달라진다는 관찰에 중심을 두고 있다. 예를 들어, 뇌에서 발현되는 유전자는 간에서 발현되는 유전자, 혹은 면역계에서 발현되는 유전자들에 비하여 느리게 진화한다는 것이 보고 된 바 있다. 이 경우에, 딱히 뇌에서 발현되는 유전자가 기능적으로 더 중요하다는 증거는 없다. 과연 무엇이 뇌에서 발현되는 유전자의 진화속도를 느리게 한 것일까? 아직 정확하게 그게 무엇인지 보고 된 바 없지만, 조직 특이적인 요소가 진화적인 선택 압력과의 상호작용을 주도하고 있는 것이 아닌가 생각된다.






ㄴ. Noncoding region의 2가지 가설

1) Selection for economy (or time selection) 가설

이 이론에 따르면, 인트론은 복제를 해야 하는 세포에게 큰 부담으로 작용한다. 또한, 많은 발현을 해야 하는 유전자의 경우에는 더욱 큰 부담이다. 어쨌든, splicing에 의해 제거되어야 하므로 세포의 입장에서 보면, 높은 수준으로 발현되는 유전자의 경우 작은 크기의 인트론을 갖는 쪽으로 진화적 압력이 작용했을 것이라고 가정한다. 실제로 다양한 연구에서 발현 정도가 높은 유전자의 인트론 길이가 짧고, 또한 동시에 CDS 길이도 짧다는 보고가 있다. 하지만 이와 반대 되는 관찰로, 특히나 식물의 경우에는 많이 발현되는 유전자가 오히려 인트론이 길다는 보고도 있다. 따라서 이 모델은 여러 분석에 의한 더 많은 검증을 요한다.




2) Genome design 가설

이 모델은 위의 모델과 달리 tissue-specific 유전자의 인트론 길이가 긴 것은 발현양이 낮아서라기 보다는 발현의 조절이 좀 더 복잡하기 때문이라고 주장한다. 즉, Housekeeping 유전자에 비해서 tissue-specific 유전자는 어떤 조직에, 어떤 시간에, 얼마큼의 양이 발현되어야 하는지에 관한, 좀 더 복잡한 조절을 필요로 하고, 인트론에 존재하는 발현 조절 부위 또한 많아야 한다고 가정한다. 이러한 가설을 뒷받침해 주는 것으로, tissue-specific 유전자를 좀 더 관찰해보면, intermediate level로 발현되는 유전자들이 유전자의 길이가 좀 더 길고, conserved intron의 proportion도 더 많다는 것이 보고 된 바 있다.







#참고 문헌

1) Liao, B. Y., Scott, N. M., & Zhang, J. (2006). Impacts of gene essentiality, expression pattern, and gene compactness on the evolutionary rate of mammalian proteins. Molecular biology and evolution, 23(11), 2072-2080.

2) Barbash, S., & Sakmar, T. P. (2017). Brain gene expression signature on primate genomic sequence evolution. Scientific reports7(1), 17329.

3) Heyn, P., Kalinka, A. T., Tomancak, P., & Neugebauer, K. M. (2015). Introns and gene expression: cellular constraints, transcriptional regulation, and evolutionary consequences. Bioessays37(2), 148-154.

4) Shaul, O. (2017). How introns enhance gene expression. The international journal of biochemistry & cell biology91, 145-155.





Genome Evolution (유전체진화) End.

BioinformaticsAndMe

'Biology' 카테고리의 다른 글

박테리아 성장곡선 (Bacterial growth curve)  (0) 2019.09.21
항체 (Antibody)  (0) 2018.09.16
비교유전체학 (Comparative genomics)  (0) 2018.09.07
Gene Fusion (유전자융합)  (0) 2018.08.21
Evolution theory (진화론)  (0) 2018.08.03

+ Recent posts