세포핵 (Cellular nucleus) Start

BioinformaticsAndMe







세포핵(Cellular nucleus)?


: 진핵생물의 진핵세포에 존재하며 세포 내 유전정보인 선형 DNA의 대부분을 가짐

: 리보솜 조립의 장소로 단백질 합성을 조절하여 세포의 활동을 조절

: 공 모양 또는 타원 모양의 형태로 지름이 20~30μ 정도의 크기

: 세포마다 한 개의 핵을 지님 (단, 적혈구는 핵이 없음)






세포 핵 구조


1. Nucleoplasm(핵질, 핵원형질)

핵 내부를 채우고 있는 불용성 물질

- RNA와 여러 종류 단백질(가수분해효소 등)을 포함

- 히스톤 단백질에 감긴 선형 DNA들에 유전 정보들이 나뉘어 존재



2. Nucleolus(인, 핵소체)

막 경계가 없으며, 리보솜 RNA(rRNA)가 합성되는 장소

- 단백질 합성이 활발한 세포에는 인의 수가 많으며, 현미경으로 더 까맣게 보임

- 세포 분열 사이에 있는 간기의 핵에서 관찰된 후, 세포 분열기에 사라짐



3. Nuclear envelope(핵막, nuclear membrane)

핵을 둘러싸 모양을 유지한채로 세포질과 구별되게 함

- 인지질 이중층의 2중막 구조이며, 일부 소포체가 연결 됨

- 핵막에는 다수의 핵공이 존재



4. Nuclear pore(핵공)

핵과 세포질 사이의 물질 출입 조절

- 작은 분자들이나 이온은 핵공을 통해 이동 (50kDa 이하 물질)

- 핵공은 약 100개의 서로 다른 단백질로 이루어짐






#Reference

1) https://ko.wikipedia.org/wiki/%EC%95%84%EB%82%98%EC%BD%98%EB%8B%A4_(%ED%8C%8C%EC%9D%B4%EC%8D%AC_%EB%B0%B0%ED%8F%AC%ED%8C%90)

2) https://namu.wiki/w/%EC%84%B8%ED%8F%AC%ED%95%B5

3) https://ko.wikipedia.org/wiki/%EC%84%B8%ED%8F%AC%ED%95%B5

4) https://en.wikipedia.org/wiki/Cell_nucleus

5) http://study.zum.com/book/13732

6) https://ko.wikipedia.org/wiki/%ED%95%B5%EA%B3%B5




세포핵 (Cellular nucleus) End

BioinformaticsAndMe

눈의 구조 (Human Eye Anatomy) Start

BioinformaticsAndMe





눈의 구조 (Human Eye Anatomy)


1. 홍채(Iris) - 동공 주위에 있는 도넛 모양의 막으로, 동공의 수축과 이완을 통해 안구로 들어오는 빛의 양을 조절


2. 각막(Cornea) - 공막이 눈 앞쪽으로 연장된 부분으로, 눈의 창문 역할을 하며 외부로부터 눈을 보호하고 빛을 통과시키고 굴절


3. 안구방수(Aqueous humor) - 홍채와 수정체 사이를 가득 채운 물 모양의 투명한 액으로 각막과 수정체에 양분 공급


4. 수정체(Lens) - 걸이인대(진대)에 매달려 있는 볼록한 렌즈 형태의 투명한 조직으로 빛을 굴절시켜 초점을 맞춤


5. 모양근(Ciliary muscle) - 섬모체근이라 불리며, 걸이인대를 이용해 수정체를 지지하고 두께 조절


6. 맥락막(Choroid) - 멜라닌 색소가 풍부하며 외부에서 들어온 빛이 분산되지 않도록 하는 역할


7, 시신경(Optic Nerve) - 시각을 인지하는 지각신경으로, 망막에 맺힌 상을 뇌로 전달하는 뇌신경


8. 중심와(Fovea) - 망막의 영역인 중심와에는 추상체(원추세포)만 밀집되어 있으므로, 가장 해상력이 좋고 예민하게 반응하는 곳


9. 망막(Retina) - 안구의 가장 안쪽을 덮고 있는 투명한 신경조직으로, 광수용기 세포들이 있어서 시각 성립에 관여


10. 황반(Macula) - 중심와 주위에 노란색을 띠는 부분으로, 시세포가 밀집되어 있어 빛을 선명하고 정확하게 받아들이는 부분


11. 유리체방수(Vitreous humor) - 콜라겐, 하이알루론산 등 투명한 젤리같은 물질들로 이루어져 눈의 모양을 유지


12. 공막(Sclera) - 눈의 겉을 감싼 흰자로 보이는 부분으로, 외부 충격으로부터 눈을 보호하고 지지


13. 모양소체(Zonule Fibers) - 가는 섬유로 수정체에 결합하여 수정체를 주위에서 고정









#Reference

1) https://eyecheck.com/anatomy-of-the-eye-101

2) https://en.wikipedia.org/wiki/Eye

3) https://en.wikipedia.org/wiki/Human_eye

4) http://m.amc.seoul.kr/asan/mobile/healthinfo/body/bodyDetail.do?bodyId=234&partId=B000004

5) https://terms.naver.com/entry.nhn?docId=1122380&cid=40942&categoryId=32315

6) https://ko.wikipedia.org/wiki/섬모체




눈의 구조 (Human Eye Anatomy) End

BioinformaticsAndMe

하디-바인베르크 평형 (Hardy-Weinberg equilibrium) Start

BioinformaticsAndMe





하디-바인베르크 법칙

: 하디-바인베르크 법칙(=하디-와인버그 평형)이란 유전자 풀에서 세대를 거쳐 대립 유전자 빈도가 변하지 않고 평형상태를 유지한다는 원리

: 영국 수학자 Godfrey Harold Hardy와 독일 의사 Wilhelm Weinberg가 각자 동시에 발견한 법칙




하디-바인베르크 평형에 도달하기 위한 집단 조건

1. 자연 선택(natural selection) 일어나지 않음

2. 돌연변이(mutation) 없음

3. 유입, 유출(migration)의 유전자 흐름 없음

4. 대규모 집단(population)

5. 무작위 교배(random mating)





하디-바인베르크 방정식

위의 전제 조건들을 만족하는 이상 집단에서 아래 수식들이 성립

ㄱ. Allele Frequency Equation: p + q = 1

대립 유전자 A 빈도(A allele frequency):  p

대립 유전자 a 빈도(a allele frequency):  q

세대를 거듭해도 p + q = 1 로 일정

ㄴ. Genotype Frequency Equation: p2 + 2pq + q2 = 1

AA 유전자형의 빈도(AA genotype):  p2

Aa 유전자형의 빈도(Aa genotype):  2pq

aa 유전자형의 빈도(aa genotype):  q2

세대를 거듭해도 p2 + 2pq + q2 = 1 로 일정



1st Generation (1세대)



2nd Generation (2세대)


위 예제는

대립유전자형 빈도(Allele frequency)와 유전자형 빈도(Genotype frequency)가

세대를 거듭해도 일정한 비율로 유지되는 현상을 볼 수 상황이다





하디-와인버그 평형이 깨진다면 (=평형 방정식이 성립되지 않는다면)

언급되었던 조건이 위배되었을 가능성이 높다


무작위 교배 대신 선별적 교배가 일어났거나,

대규모 집단 대신 작은 규모의 집단이었거나,

돌연변이/자연선택/인구이동이 발생했는지 살펴봐야겠다.





#Reference

1) https://ko.wikipedia.org/wiki/%ED%95%98%EB%94%94-%EB%B0%94%EC%9D%B8%EB%B2%A0%EB%A5%B4%ED%81%AC_%EC%9B%90%EB%A6%AC

2) https://namu.wiki/w/%ED%95%98%EB%94%94-%EB%B0%94%EC%9D%B8%EB%B2%A0%EB%A5%B4%ED%81%AC%20%EB%B2%95%EC%B9%99

3) http://evieiraapbio.blogspot.com/2016/05/hardy-weinberg-equilibrium.html

4) http://www.hammiverse.com/instructionalunits/evolution/chp22-25lecture/print/lecture2-4.html





하디-바인베르크 평형 (Hardy-Weinberg equilibrium) End

BioinformaticsAndMe

'Biology' 카테고리의 다른 글

세포핵 (Cellular nucleus)  (0) 2019.10.08
눈의 구조 (Human Eye Anatomy)  (0) 2019.10.03
박테리아 성장곡선 (Bacterial growth curve)  (0) 2019.09.21
항체 (Antibody)  (0) 2018.09.16
비교유전체학 (Comparative genomics)  (0) 2018.09.07

박테리아 성장곡선 (Bacterial growth curve) Start

BioinformaticsAndMe





박테리아 성장곡선

: 박테리아 집락 증가의 시그모이드 곡선

: 세균 배양에서의 균수와 배양 시간의 관계를 나타냄

: 시그모이드형 생장은 처음에는 천천히 생장하다가, 뒤이어 급속히 생장한 후, 마지막 단계에는 서서히 저하하다가 결국 정지



1) Lag phase (유도기, 지연기)

- 처음 배양액에 접종 후 적응하는 시기

- 세균이 새로운 환경에 적응하느라 세포 수가 크게 증가하지 않는 시기

- 새로운 환경에 적응하기 위해 필요한 다양한 인자 합성

- 배양한지 오래된 배지 혹은 냉동 보관했던 세균들은 지연기가 길어짐

- 같은 조성의 배지로 옮기면 지연기가 짧거나 거의 없음


2) Exponential phase (대수 성장기, 대수기)

- 세균들이 최고속도로 성장, 분열하는 시기

- 세포의 화학적 생리적 특징이 균일

*대수 성장기 세균들로 진행되는 연구는 균일한 결과를 얻기 좋음

- 영양물질 농도에 따라 성장속도 증가


3) Stationary phase (정체기, 정지기)

- 박테리아 성장 정지

- 세포 분열과 세포 사멸 속도가 평형 이룸

- 발생원인: 영양물질 부족, 독성노폐물 축적, 집단 임계밀도


4) Death phase (사멸기)

- 세균들의 성장에 불리한 환경에 진입

- 생균수 감소

- 대수적으로 감소









#Reference

1) https://www.scienceall.com/%EC%83%9D%EC%9E%A5%EA%B3%A1%EC%84%A0growth-curve/

2) https://zetawiki.com/wiki/%EC%83%9D%EC%9E%A5%EA%B3%A1%EC%84%A0,_%EC%84%B1%EC%9E%A5%EA%B3%A1%EC%84%A0

3) http://download.systemsbiology.nl/~jasperk/koen/Practical/WetLab/Week4/Tuesday/GrowthCurve/

4) http://webbuild.knu.ac.kr/~app-mic/resources/lecture/dairy%20microbiology/chap3-microbial%20growth.pdf





박테리아 성장곡선 (Bacterial growth curve) End

BioinformaticsAndMe

항체 (Antibody) Start.

BioinformaticsAndMe




1. 항체 (Antibody) 정의

- 항원과 특이적 결합을 하여 항원-항체 반응을 일으키는 물질.

- 흔히 책에는 Y 모양으로 그림. 줄여서 Ab로 사용. 

- 포유류의 항체는 IgA, IgD, IgE, IgG, IgM 다섯 가지로 나뉨.






2. 항체 구조 (Structure)

- 항체는 불변 영역(Constant region)과 가변 영역(Variable region)으로 나뉨. 

- 가변 영역은 항원에 결합하고 불변 영역은 항체의 형상을 결정하는 데 쓰임.

- 또한 중사슬(Heavy chain)과 경사슬(Light chain)로도 구분.

- 중사슬은 가변 영역과 불변 영역에 존재하고, 경사슬은 가변 영역에만 존재. 






#참고문헌

1) https://namu.wiki/w/%ED%95%AD%EC%B2%B4






항체 (Antibody) End.

BioinformaticsAndMe

비교유전체학 (Comparative genomics) Start.

BioinformaticsAndMe









1. 비교유전체학(Comparative genomics) 정의

- 인간 유전체 연구를 위해서 여러 생물종을 모델로 이용하여 인체 생명현상 및 질환을 연구.

- 서로 다른 생물 간의 유전체를 DNA 혹 PROTEIN수준에서 비교.





2. 형질에 영향을 주는 molecular mechanisms

- 이전의 진화모델은 Gene (mutation) 수준과 Population (selection) 수준으로 설명되었다.

- 더하여, 'biased embryos model'은 Organism 수준에서 developmental reprogramming의 4가지 진화방식을 설명한다.


heterochrony - change due to change in timing (유전자 발현의 타이밍 변형)

heterotopy - change in the position at which a character is expressed (위치적 발현양의 변형) 

heterometry - a change in quantity or degree of gene expression (유전자 발현 총량의 변형)

heterotypy - phenotypic change from one type to another (유전자에 의한 산물의 변형)





3. 유전자 상동성 (Homology)

- Homology : 어떠한 형질이 진화의 과정 동안 보존된 것을 말하며, 이는 형태적 형질이나 분자적 형질, 유전자 서열도 해당.

Ortholog : 한 개체가 진화되어 여러 종으로 분화되었을 때, 유전자의 기능이 그대로 보존되어 서로 유사한 기능을 수행하는 것을 의미.

 Speciation (종의 분화).

Paralog : 한 조상에서 온 유전자지만, 서열은 유사해도 기능이 좀 달라진 것들을 의미.

     Gene Duplication (유전자 중복).





4. dN/dS 분석

- dN/dS 분석 : Nonsynonymous 변이와 Synonymous 변이를 고려하여 진화속도 추정.

▶ Nonsynonymous (dN): 아미노산을 변형시키는 염기 돌연변이 (Selection-dependent).

▶ Synonymous (dS): 아미노산을 변형시키지 않는 염기 돌연변이 (Time-dependent).

▶ dN/dS > 1 : Positive selection, 기존 상태를 벗어나려 한다. 진화속도가 빠르다.

▶ dN/dS = 1 : Neutral selection, 중립적이다.

▶ dN/dS < 1 : Negative(Purifying) selection, 기존 상태를 유지하려 한다. 진화속도가 느리다. 


- 흔히, PAML (Phylogenetic Analysis by Maximum Likelihood)을 통해 dN/dS 계산한다.

- dN/dS 분석시, 시퀀스의 conservation이 어느 정도 높은 구간에서 사용하도록 권장한다. Conservation이 낮은 곳에서 분석되면 무의미한 variant에 의해 의미없는 dN/dS 값이 산출될 것이다.






#참고문헌

1) Epigenetic Regulation of Trinucleotide Repeat Expansions and Contrac-tions and the “Biased Embryos” Hypothesis for Rapid MorphologicalEvolution [accessed Sep 07 2018].

2) https://en.wikipedia.org/wiki/Ka/Ks_ratio.





비교유전체학 (Comparative genomics) End.

BioinformaticsAndMe

'Biology' 카테고리의 다른 글

박테리아 성장곡선 (Bacterial growth curve)  (0) 2019.09.21
항체 (Antibody)  (0) 2018.09.16
Genome Evolution (유전체진화)  (0) 2018.08.24
Gene Fusion (유전자융합)  (0) 2018.08.21
Evolution theory (진화론)  (0) 2018.08.03

Genome Evolution (유전체진화) Start.

BioinformaticsAndMe






오늘은 Genome Evolution을 설명하기 위한 가설들을 살펴보겠다.

게놈의 진화는 코딩(Coding)논코딩(Noncoding)으로 나누어 설명된다.


#참고로 코딩과 논코딩이 뭔지 모른다면 아래 정도로 이해하면 된다.

ㄱ. Coding region(암호화영역) - 단백질을 만들어내는 아미노산 서열

ㄴ. Noncoding region(비암호화영역) - 코딩 부위 아닌 서열




ㄱ. Coding region의 3가지 가설

1) 기능 중심 가설 (Function-centered hypothesis)

유전자진화에 있어서 가장 중요한 변수가 바로 기능의 중요성이라는 것이다. 이는 분자진화학이 태동한 이래 지난 40여년동안 중심 가설이 되어 왔다. 이 모델에 따르면, 기능이 중요한 유전자들은 진화적으로 선택 압력을 매우 강하게 받음으로 인해, 돌연변이가 생기더라도 당대에 도태시킴으로써 다음 자손에 돌연변이 된 유전자를 전달시키지 않는다. 따라서 기능이 중요한 유전자는 덜 중요한 유전자에 비해 그 진화 속도가 매우 느리게 된다. 


아래 그림은 Essential gene(중요 유전자)들이 Non-essential gene들에 비해 진화율이 낮다는 것을 의미한다.

c 그림의 dn/ds가 낮을수록 진화율이 낮은(보존율이 높은) 것을 의미한다.



2) 발현 중심 가설 (Expression-centered hypothesis)

발현 중심 가설은 기능 중심 가설에 정면으로 도전한다. 유전자의 중요도 보다는, 오히려 유전자의 발현 정도가 진화율을 결정한다고 주장한다. 이는, 대량의 게놈 데이터를 사용한 분석에서 중요도와 진화율 간에 역의 관계가 유의하게 나오지만, 기대만큼 강하게 나오지 않는다는 관찰에 바탕을 두고 있다. 오히려 다양한 생물 종에서 관찰한 결과, 가장 유의한 차이를 보이는 것은 바로 발현 정도(expression abundance)라는 것이다. 이 가설에 의하면, 높은 수준으로 발현되는 유전자는 낮은 수준으로 발현되는 유전자에 비해 최적의 코돈(codon)을 선호하는 경향성을 나타내게 되고, 따라서 코돈의 3번째 위치의 substitution rate이 많이 발현되는 유전자의 경우에 더 느려 진다는 것이다. 뿐만 아니라, Drummond 그룹이 제창한 Mistranslation-induced misfolding (MIM) hypothesis에 의하면, 많이 발현되는 유전자는 mistranslation에 의한 misfolding으로 인해, 자연선택의 압력을 더욱 거세게 받는다. 즉, 많이 발현되는 유전자 일수록 mistranslation에 의한 deleterious effect가 더 심하게 나타날 수 있고, 따라서 이를 막는 residue의 진화율이 낮아진다고 설명한다.




3) 조직 중심 가설 (Tissue-centered hypothesis)

이 가설은, 조직에 따라 발현 되는 유전자의 종류가 달라지고, 따라서 진화율이 달라진다는 관찰에 중심을 두고 있다. 예를 들어, 뇌에서 발현되는 유전자는 간에서 발현되는 유전자, 혹은 면역계에서 발현되는 유전자들에 비하여 느리게 진화한다는 것이 보고 된 바 있다. 이 경우에, 딱히 뇌에서 발현되는 유전자가 기능적으로 더 중요하다는 증거는 없다. 과연 무엇이 뇌에서 발현되는 유전자의 진화속도를 느리게 한 것일까? 아직 정확하게 그게 무엇인지 보고 된 바 없지만, 조직 특이적인 요소가 진화적인 선택 압력과의 상호작용을 주도하고 있는 것이 아닌가 생각된다.






ㄴ. Noncoding region의 2가지 가설

1) Selection for economy (or time selection) 가설

이 이론에 따르면, 인트론은 복제를 해야 하는 세포에게 큰 부담으로 작용한다. 또한, 많은 발현을 해야 하는 유전자의 경우에는 더욱 큰 부담이다. 어쨌든, splicing에 의해 제거되어야 하므로 세포의 입장에서 보면, 높은 수준으로 발현되는 유전자의 경우 작은 크기의 인트론을 갖는 쪽으로 진화적 압력이 작용했을 것이라고 가정한다. 실제로 다양한 연구에서 발현 정도가 높은 유전자의 인트론 길이가 짧고, 또한 동시에 CDS 길이도 짧다는 보고가 있다. 하지만 이와 반대 되는 관찰로, 특히나 식물의 경우에는 많이 발현되는 유전자가 오히려 인트론이 길다는 보고도 있다. 따라서 이 모델은 여러 분석에 의한 더 많은 검증을 요한다.




2) Genome design 가설

이 모델은 위의 모델과 달리 tissue-specific 유전자의 인트론 길이가 긴 것은 발현양이 낮아서라기 보다는 발현의 조절이 좀 더 복잡하기 때문이라고 주장한다. 즉, Housekeeping 유전자에 비해서 tissue-specific 유전자는 어떤 조직에, 어떤 시간에, 얼마큼의 양이 발현되어야 하는지에 관한, 좀 더 복잡한 조절을 필요로 하고, 인트론에 존재하는 발현 조절 부위 또한 많아야 한다고 가정한다. 이러한 가설을 뒷받침해 주는 것으로, tissue-specific 유전자를 좀 더 관찰해보면, intermediate level로 발현되는 유전자들이 유전자의 길이가 좀 더 길고, conserved intron의 proportion도 더 많다는 것이 보고 된 바 있다.







#참고 문헌

1) Liao, B. Y., Scott, N. M., & Zhang, J. (2006). Impacts of gene essentiality, expression pattern, and gene compactness on the evolutionary rate of mammalian proteins. Molecular biology and evolution, 23(11), 2072-2080.

2) Barbash, S., & Sakmar, T. P. (2017). Brain gene expression signature on primate genomic sequence evolution. Scientific reports7(1), 17329.

3) Heyn, P., Kalinka, A. T., Tomancak, P., & Neugebauer, K. M. (2015). Introns and gene expression: cellular constraints, transcriptional regulation, and evolutionary consequences. Bioessays37(2), 148-154.

4) Shaul, O. (2017). How introns enhance gene expression. The international journal of biochemistry & cell biology91, 145-155.





Genome Evolution (유전체진화) End.

BioinformaticsAndMe

'Biology' 카테고리의 다른 글

박테리아 성장곡선 (Bacterial growth curve)  (0) 2019.09.21
항체 (Antibody)  (0) 2018.09.16
비교유전체학 (Comparative genomics)  (0) 2018.09.07
Gene Fusion (유전자융합)  (0) 2018.08.21
Evolution theory (진화론)  (0) 2018.08.03

Gene Fusion (유전자융합) Start.

BioinformaticsAndMe




1. Gene Fusion 이란?

- 복수의 다른 유전자가 재조합 등에 의해 융합단백질을 코드하게 되는 것

- Fusion gene: 유전체에 별개로 존재하는 두 유전자가 융합돼 하나로 동작하는 유전자

- 삽입(Insertion), 결실(Deletion), 전좌(Translocation), 역위(Inversion) 등 염색체의 구조적 이상으로 인하여 발생


 

BCR-ABL fusion: 전좌로 두 유전자가 융합 → 만성골수성백혈병(CML)을 유발.



- 아래 그림처럼 유전자 DNA의 어떤 부위가 결합하냐에 따라 Fusion Effect는 달라질 것이다.

- 첫번째를 보면,  DNA fusion으로 5` promoter의 강렬한 자극?을 받아 빨강이 protein이 급격히 늘어났다 (Deregulation 상태).

- 나머지 부분은 키메라 단백질이 만들어질 수도, 단백질 기능을 잃을 수 있다는 예이다.





2. Fusion gene 기작

- Gene Fusion은 두 가지 mechanism 형태로 발생한다.

(A) 구조적 재배열

전좌, 역위, 결손, 삽입과 같은 염색체 구조 재배치로 Gene Fusion을 형성한다. Hybrid된 gene은 센트럴 도그마(DNA->RNA->PROTEIN) 진행.

(B) 비구조적 재배열

인접한 유전자의 번역초과(readthrough) 또는 mRNA 사이의 스플라이싱(Trans-, Cis-)으로 Fusion Transcript가 형성된다.


- Gene Fusion의 주요 메카니즘은 (B)비구조적 재배열이라 알려져 있다.





3. Fusion에 의한 생물학적 특징

- 체내에서 Fusion의 생물학적 특징을 살펴보자.

(A) Gene fusion 현상은 Cancer에세 매우 다양한 형태로 발생한다.

(B) 대부분 Fusion gene들은 단지 몇몇개의 파트너 유전자와 융합하고, 암종에 따라 다양한 Fusion Network를 갖는다.

(C) 암에서 Fusion의 빈도가 적을때도, 많을때도 있다. Fusion의 빈도는 체세포변이(somatic mutation) 빈도에 반비례한다.

(D) Fusion gene들이 주로 Kinase, DNA-binding, Chromatin-modifying 기작에 관련되어있다.


- 특정 유전자의 Fusion 빈도와 Somatic mutation 빈도가 anti-correlation이라는 점이 흥미롭다, 체세포변이가 많은 유전자는 Fusion이 적게 일어난다.

- 위에 체세포변이 관련 내용은 모든 암종 및 연구환경에서 anti-correlation 관계가 형성된다고 확신할수는 없다. 참고정도로 해두면 좋을듯 하다.





4. Fusion gene의 구조적 특징

- Fusion gene의 구조적 특징을 살펴보자.

(A) Fusion gene의 Breakpoint가 in-frame에 생기는 경향이 있어 구조 자체를 잘 보존하려고 한다.

(B) Fusion gene 자체가 domain이 몇개밖에 없지만, Fusion transcript에서는 평균보다 더많은 domain을 encoding한다.

(C) Fusion protein에서는 기존에 없던 domain recombination이 보인다.

(D) Fusion protein 구조에서의 무질서가 증가할수록 다양한 domain들의 interaction을 촉진한다.






5. Fusion gene의 발현 패턴

- Fusion gene의 발현 패턴을 살펴보자.

(A) Fusion gene의 Parent gene들은 유전자 발현이 높은 편인데, Fusion gene은 발현이 낮고, 조직특이적(tissue-specific)하다.

(B) 5` 쪽의 active promoter와 3` 쪽의 안정적인 3UTR이 페어링하면 Fusion이 아주 잘 일어날 것이다.

(C) Fusion transcript에서 실제로 protein으로 translation되는 경우가 매우 희귀하다 (대부분의 fusion이 false positive일 가능성).

(D) Cancer 관련된 Fusion이 정상세포에서 발견된다.


- NGS에서 Fusion 찾는 알고리즘이 굉장히 많은데, 위에 언급한 False positive를 최대한으로 줄여야 실제로 의미있는 Fusion gene을 찾을 수 있겠다.




6. Fusion Gene tool

- 아래는 RNAseq으로 Fusion을 찾는 대표 NGS Tool이 되겠다.

- Group에 있는 표현은 해당 툴에 적용 가능한 데이터와 알고리즘 설명이다.

- fastq 데이터가 single-end, paired-end 인지? Alignment에서 리드를 조각내는 과정이 있는지? 등

- 구체적인 방법은 'Bioinformatics Tool' 칼럼에서 다시 다룰 예정이다.




#아래 논문을 참고하였다.

1)Latysheva, N. S., & Babu, M. M. (2016). Discovering and understanding oncogenic gene fusions through data intensive computational approaches. Nucleic acids research, 44(10), 4487-4503.

2)Kumar, S., Vo, A. D., Qin, F., & Li, H. (2016). Comparative assessment of methods for the fusion transcripts detection from RNA-Seq data. Scientific reports, 6, 21597.




Gene Fusion (유전자융합) End.

BioinformaticsAndMe

'Biology' 카테고리의 다른 글

박테리아 성장곡선 (Bacterial growth curve)  (0) 2019.09.21
항체 (Antibody)  (0) 2018.09.16
비교유전체학 (Comparative genomics)  (0) 2018.09.07
Genome Evolution (유전체진화)  (0) 2018.08.24
Evolution theory (진화론)  (0) 2018.08.03

Evolution theory (진화론) Start.

BioinformaticsAndMe




진화론이란 재밌는 주제를 살펴볼까 한다.

유전체 분야에서도 종간 비교라던지, 종의 기원을 찾는 등 진화의 개념이 사용된다.

또한, Phastcon, PhlyloP score 등의 conservation score(진화적 보존값)을 이용하여,

특정 locus의 Functional constraint를 살피기도 한다.

다시 말해, 우리가 variant calling으로 어떤 질병의 변이를 찾았는데, Functional constraint가 높다면

진화적으로 매우 보존되어 있는 구간에서의 변이가 생긴 것이므로, 해당 질병의 causal variant일 가능성이 높다.

이번 칼럼에서 Evolution의 모든 것을 다룰 수는 없고, 개인적으로 진화론의 철학적인 부분도 좋아하므로,

역사적 배경과 함께 genome evolution 내용을 다뤄보겠다.





1. 다윈의 진화론 (Evolutionary theory)

정의: 자연선택(natural selection), 돌연변이(variation)에 의해 이루어지는 생물 세대에 걸친 변화.

- 자연선택: 주어진 환경 조건에서 유리한 (Selective pressure) 유전인자를 가진 개체가 그렇지 않은 개체보다 생존률, 생식률이 높아진다는 진화 이론.

- 자연선택의 특징

(1) 변이는 모든 생물의 기본적 특성.

(2) 모든 생물은 후손을 과잉생산하므로 대부분은 번식시기 이전에 죽음.

(3) 먹이, 공간, 배우자 등의 자원 경쟁이 발생.

(4) 경쟁 자원을 잘 획득하고 이용하는 개체들만 생존.

(5) 선택된 형질은 다음 세대로 전달.


#역사 참고

- 다윈이 1859년 종의 기원을 집필하면서 진화론이 대두되었는데, 다윈에게 영향을 준 여러 요소들이 있었다.

1) 페일리의 '자연신학' (1802):

   생명체의 완벽한 적응 사례를 통해 신의 존재 논증 -  '환경에 대한 유기체의 적응이라는 문제 제공'

2) 맬서스의 '인구론' (1798):

   인구와 식량(환경)의 불균형은 불가피하고, 일부의 가난과 도태를 벗어나려면 ‘도덕적 절제’ 필요 - '생존경쟁(struggle for life) 아이디어 제공'

3) 라이엘의 '지질학원리' (1830) :

   지표면의 변화는 현재 우리 주변의 원인으로 설명되어야 한다는 동일과정설 제안(vs. 격변설) - '점진적인 종의 변화에 필요한 매우 긴 시간 확보'





2. 유전적 변화를 일으키는 주요 기작(가설)

ㄱ)Mutation within a gene

 - DNA replication 혹 repair 과정중에서 실수가 발생하여 유전자 내 변이가 생김.

 - 변이는 새로은 phenotype의 요인이 될 수 있지만, 대부분 개체에 영향을 주지 않는 Neutral한 특징을 가짐.

 - 위 논문을 참고하여, 인간에 경우 1년에 0.5 x 10-9 의 mutation rate을 보인다고 한다. 30억 염기로 계산해보면 1년에 1.5 염기가 변한다고 한다.

 - 명심해야할 점은 위 돌연변이 발생률은 germline에 해당된다. Cancer somatic mutation rate은 암종마다 다른 것으로 알고 있다.

 - 변이가 생긴다하여도 유전체 대부분은 junk로 보기 떄문에, 통계적으로 봤을때 junk에 변이가 생길 가능성이 높다.


ㄴ)Gene duplication

 - 유전자 중복(gene duplication)은 척추동물의 거의 모든 유전자들이 진행한 기작이라 보고 있다.

 - 유전자들이 자신의 복제하여 gene family로 묶이는 것을 흔히 볼 수 있다.

 - 한번 생각해보자. gene duplication으로 발생한 유전자들은 체내에서 같은 기능을 할 것이므로 모든 유전자가 활성화 될 필요가 없을 것이다.

 - 그럼 몇몇 쓰이지 않는 유전자들이 생길 것이고, genome 상에 흔적으로만 남아있을 것이다 (pseudogene, 위유전자).

 - 쓰이지 않는 유전자들은 위에서 언급한 functional constraint가 감소할 것이므로 변이가 일어날 가능성이 크다.

 - pseudogene은 기능이 없다는게 정설이지만, 몇몇 연구에서는 유전체에서 위상학적으로 다른 유전자에 영향을 줄 것이란 내용도 있다.

 - 아래 그림은 Gene duplication을 일으키는 3가지 사례를 말한다.


ㄷ)Exon shuffling

ㄹ)Horizontal gene transfer





3. Hardy–Weinberg principle (하디-바인베르크 원리)

- 개체군이 가지는 유전자풀 안에서 여러 유전자들의 비율은 세대를 거듭해도 그대로 유지된다는 법칙.

대립유전자 빈도 평형 : p + q = 1

유전자형 빈도 평형 : p2 + 2pq + q2 = 1

- HW 법칙은 4가지 가정에 기반한다.

무작위 교배가 이루어져야한다.

집단이 매우 커야한다.

돌연변이나 이주가 없다.

집단간의 유전자흐름이 없다.

하디-와인버그 가정에 벗어나면 진화에 놓여있다.

- 흔히 GWAS 분석에서 HW 가설을 기각하는 SNP들을 제외하는데, 그런 SNP들은 Phenotype보다 genotyping error로 여기기 떄문이다.

- 우리가 주로 연구하는 사람은 같은 종이므로 하디웨인버그법칙을 거스를 정도의 진화적 변화를 보이지 않을 것이라 본다.




마무리하며...

원래 계획은 라마르크 용불용설과 후성유전학(epigenetics) 사이의 관계를 조명하며 끝내려했지만...

다음 칼럼에 다시 다루겠다 (글을 쓰다보니 내용이 다소 중구난방한 점 죄송합니다..).

#라마르크 용불용설은 일부 식물의 메틸화된 유전자가 그대로 유전되는 것이 확인되어 재조명받고 있다.




Evolution theory (진화론) End.

BioinformaticsAndMe

'Biology' 카테고리의 다른 글

박테리아 성장곡선 (Bacterial growth curve)  (0) 2019.09.21
항체 (Antibody)  (0) 2018.09.16
비교유전체학 (Comparative genomics)  (0) 2018.09.07
Genome Evolution (유전체진화)  (0) 2018.08.24
Gene Fusion (유전자융합)  (0) 2018.08.21

+ Recent posts