KEGG pathway Start

BioinformaticsAndMe






KEGG(Kyoto Encyclopedia of Genes and Genomes)?


: KEGG pathway는 일본에서 만들어진 생화학 패스웨이 데이터베이스 (1995)

: 생물학 연구 분야에서 가장 많이 인용되는 DB 중 하나로 아래의 정보들에 기반을 둠

ㄱ) Systems information - 생화학 정보들 사이의 네트워크 상호작용 정보

ㄴ) Genomic information - 유전자 및 단백질 수준의 분자 단위 정보

ㄷ) Health information - 생체계에 영향을 주는 질병 및 약물 정보

ㄹ) Chemical information - 화학 물질 수준의 분자 단위 정보

https://www.genome.jp/kegg/pathway.html





KEGG Mapper Search&Color pathway


: KEGG Mapper에는 보유한 유전자들의 발현양에 따라, 패스웨이 특정 구간에 색을 표시하는 Search&Color pathway 웹툴이 존재

: 아래 유전자 발현 변화들이 Pathway 어느 구간에 영향을 미쳤는지 분석 수행

*green 색 - Fold change < 0 

*red 색 - Fold change > 0 

Gene symbol

NCBI gene ID

Fold change

Color

ATF3

467

-4

green

CLCN6

1185

-4

green

COA6

388753

3

coral

CYP4Z2P

163720

2

coral

EPHA2

1969

5

coral

ERRFI1

54206

2

coral

F3

2152

-2

green

GADD45A

1647

3

coral

GCLM

2730

-2

green

HSPA6

3310

2

coral

IER5

51278

3

coral

IFFO2

126917

3

coral

IFI44L

10964

3

coral

IL24

11009

3

coral

JUN

3725

-3

green

LINC00624

100289211

-4

green

MIR4427

100616390

-5

green

NBPF18P

441908

-2

green

NBPF25P

101929780

2

coral

NGF

4803

2

coral


: https://www.genome.jp/kegg/tool/map_pathway2.html


Search&Color pathway 분석 과정

1) 'NCBI gene ID'와 'Color' 열만 복사해 공란에 붙여 넣어 줌

2) Organism-specific 옵션은 hsa(homo sapiens)

3) Optional use of outside ID 옵션은 NCBI-GeneID

4) Use uncolored diagrams 옵션에 체크

5) Exec 실행

6) 매칭된 Pathway 리스트 확인

7) Pathway 결과 시각화










#좀 더 상세한 시각화 작업은 R의 pathview 패키지로 수행

https://bioinformaticsandme.tistory.com/104





#Reference

1) https://www.genome.jp/kegg/pathway.html

2) https://ko.wikipedia.org/wiki/KEGG

3) https://www.genome.jp/kegg/tool/map_pathway2.html




KEGG pathway End

BioinformaticsAndMe

[Cloning] 생명 복제 Start

BioinformaticsAndMe






생명 복제 (Cloning)


: 생명 복제란 생식세포복제 또는 체세포복제 등의 방법으로 유전 정보가 같은 생명체를 복제하는 것

*생식세포복제 - 수정란 분할을 이용한 복제

*체세포복제 - 성체 체세포에서 핵을 떼어 이를 착상

: 영국의 월머트 박사는 체세포 복제술을 이용해 복제양 '돌리'를 탄생시킴 (1996)





1. 생식세포복제 (Germ cell cloning)


: 생식세포복제란 난자와 정자가 결합한 수정란의 분할과정에 있는 난세포(할구)를 공여핵 세포로 이용하는 것

→난할 중인 배아의 세포들을 각각 쪼개서 따로 발생을 유도함
: 배아가 자궁에 착상이 어렵거나, 유산이 빈번한 불임 부부들을 위해 응용할 수 있음
: 배양보조 세포와 함께 섞어 포배기까지 키운 뒤 대리모 자궁에 착상함
→착상된 각각의 배아는 유전적으로 똑같은 개체들로 자랄 수 있음





2. 체세포복제 (Somatic cell nuclear transfer;SCNT)


: 체세포복제는 체세포핵치환이라 불리며, 생식세포복제와 다르게 정자와 난자의 결합 과정이 없음

: 핵을 제거한 난자에 몸에서 떼어 낸 세포를 집어 넣어 동물을 복제하는 행위

→복제를 원하는 개체의 체세포 핵과 중심체를 꺼낸 뒤, 난자에 핵 치환하여 배양함

: 포배기까지 키운 뒤 대리모의 자궁에 착상함

→태어난 개체는 핵을 공여한 개체와 모든 유전자가 동일

→체세포복제로 태어난 개체의 염색체는 텔로미어 길이가 정상에 비해 매우 짧음








# 체세포 핵치환 실험 과정









#Reference
1) https://ko.wikipedia.org/wiki/%EB%B3%B5%EC%A0%9C_(%EC%83%9D%EB%AC%BC%ED%95%99)
2) https://terms.naver.com/entry.nhn?docId=69143&cid=43667&categoryId=43667
3) https://nextnature.net/2008/01/fake-for-real-dolly-the-cloned-sheep
4) https://m.lawtimes.co.kr/Content/Article?serial=13311
5) https://terms.naver.com/entry.nhn?docId=933226&cid=43667&categoryId=43667
6) https://www.youtube.com/watch?v=UkQywW6cTuI#action=share



[Cloning] 생명 복제 End

BioinformaticsAndMe

'Technology' 카테고리의 다른 글

[Dialysis] 인공투석  (0) 2019.11.26
[ELISA] 효소결합면역흡착검사  (0) 2019.11.18
[Mircoarray] DNA 미세배열  (0) 2019.11.05
[DNA sequencing] 생어 염기서열 분석  (0) 2019.10.28
[Western blotting] 웨스턴 블로팅  (0) 2019.10.22

조직 (Tissue) Start

BioinformaticsAndMe







조직(Tissue)?


: 비슷한 형태나 기능을 가진 세포의 모임 (같은 종류의 세포집단)

: 생물체 내에서 분화의 방향이 같음

: 인체는 크게 4가지의 기본조직으로 구성됨

1) 상피조직

2) 결합조직

3) 근육조직

4) 신경조직




1. 상피조직 (Epithelial tissue)


: 세포가 밀착해서 배열되어, 몸의 표면을 덮거나 기관 내벽을 이룸

: 주변 환경으로부터 물리적, 화학적 방어/흡수/분비를 수행

: 상피조직은 층의 형태를 근거해 4개로 분류

ㄱ) 단층상피(Simple epithelium) - 1겹의 세포로 이루어진 얇은 층(폐포, 모세혈관)

ㄴ) 중층상피(Stratified epithelium) - 여러겹의 세포로 이루어진 두꺼운 층(피부 표피)

ㄷ) 다열상피(Pseudostratified epithelium) - 중층상피처럼 보이나 실제로 단층상피(기도 점막)

ㄹ) 이행상피(Transitional epithelium) - 층에 따라 세포의 모양이 달라짐(방광)

: 상피조직은 세포 모양을 근거해 3개로 분류

ㄱ) 비늘모양(Squamous)

ㄴ) 정육면체(Cuboidal)

ㄷ) 직육면체(Columnar)





2. 결합조직 (Connective tissue)


: 다른 조직을 연결하고 지지하는 역할

: 여러 기관들의 틈을 메우고 서로 연결시켜 내부 장기를 보호함

: 대부분의 결합조직은 콜라겐(Collagen)과 엘라스틴(Elastin)으로 구성

: 결합조직은 성긴결합조직/치밀결합조직/뼈/지방조직/연골/혈액으로 분류

ㄱ) 성긴결합조직(Loose connective tissue)

- 섬유아세포와 콜라겐, 엘라스틴 등이 풍부한 탄력 조직으로 기관들을 보호하고 피하조직을 이룸

ㄴ) 치밀 결합조직(Dense connective tissue)

- 콜라겐 섬유가 치밀하게 연결된 조직으로 힘줄/인대/안구공막을 이룸

ㄷ) 뼈(Bone)

- 골아세포가 콜라겐과 수산화인희석을 분비해서 단단한 조직을 이룸

ㄹ) 지방조직(Adipose tissue)

- 지방세포들이 성기게 결합해서 피하 지방을 이룸

ㅁ) 연골(Cartilage)

- 연골세포가 콜라겐/콘드로이틴황산염/엘라스틴 등을 분비해서 뼈의 완충작용을 하는 조직을 이룸

ㅂ) 혈액(Blood)

- 물/이온/피브리노겐/알부민 등의 수용성 단백질들과 혈구 세포 등이 약하게 결합한 조직을 이룸





3. 근육조직 (Muscular tissue)


: 근육은 동물의 신체 운동에 관여하는 조직으로 수축능력이 있는 근세포로 이루어짐

: 근육조직은 3가지로 분류

ㄱ) 골격근육(skeletal muscle)

ㄴ) 민무늬근육(smooth muscle)

ㄷ) 심장근육(cardiac muscle)





4. 신경조직 (Nervous tissue)


: 몸 곳곳에 자극에 대한 감각/통합/반응에 관여

: 항상성 조절을 하기 위해, 전기적 신호를 단기적으로 전달

: 말초조직에서 인지한 감각을 중추신경계로 전달하고, 중추신경계의 반응을 말초신경계로 전달
: 신경조직은 뉴런(신호 전달)과 교세포(뉴런을 지지)로 이루어짐






#Reference

1) https://terms.naver.com/entry.nhn?docId=1142126&cid=40942&categoryId=32319

2) https://namu.wiki/w/%EC%A1%B0%EC%A7%81%ED%95%99

3) http://contents.kocw.or.kr/KOCW/document/2014/gacheon/chohwiyoung2/3.pdf

4) https://owlcation.com/stem/epithelial-tissue

5) https://www.coursehero.com/sg/anatomy-and-physiology/connective-tissues/

6) https://360fitnesszone.com/2019/07/14/types-of-muscle-tissue-information-of-muscle/

7) https://toxtutor.nlm.nih.gov/08-004.html





조직 (Tissue) End

BioinformaticsAndMe



[TensorFlow1.0] Multiple Linear Regression Start

BioinformaticsAndMe










[TensorFlow] Multiple Linear Regression(MLR)?


: TensorFlow 1.0 에서 수행되는 다중선형회귀분석(Multiple Linear Regression;MLR) 과정

*Multiple Linear Regression - 설명변수(독립변수)가 2개 이상이고, 종속변수가 1개인 회귀모형을 모델링하는 기법

: 다중선형회귀분석은 여러 독립변수를 도입함으로써, 오차값을 줄이고 결과 정확도를 높임


: 아래 표를 기반해 'Profit'을 종속변수(Dependent variable)로, 나머지를 독립변수(Independent variable)에 두는 다중회귀모형을 만들 수 있음





[TensorFlow] MLR 예제


: 텐서플로우 MLR 분석을 위한, 기업 공채 지원자 점수 예제표

지원자

1차 서류

2차 인적성 

3차 면접 

최종 점수

65

90

85

240

80

88

92

260

70

75

95

240

75

85

65

225

90

85

85

260

# '__future__' : python 2에서 python 3 문법 사용 가능

from __future__ import absolute_import, division, print_function

# 텐서플로우 라이브러리 임포트 import tensorflow as tf

# 예제 데이터

x_data = [[65., 90., 85.], [80., 88., 92.], [70., 75., 95.], [75., 85., 65.], [90., 85., 85.]] y_data = [[240.], [260.], [240.], [225.], [260.]]

# 프로그램 실행 순간에 변수값을 입력하기 위해 placedholder 함수 사용 X = tf.placeholder(tf.float32, shape=[None, 3]) Y = tf.placeholder(tf.float32, shape=[None, 1])

# 텐서플로우에서 학습될 W(Weight) 및 b(bias) 값을 변수(Variable) 노드로 정의

# W와 b 값의 초기값 정보가 없기에 랜덤하게 값을 설정 W = tf.Variable(tf.random_normal([3,1]), name='weight') b = tf.Variable(tf.random_normal([1]), name='bias')

# 다중회귀모형 가설 정의 (matmul 함수로 행렬곱 수행)

hypothesis = tf.matmul(X, W) + b


# cost function 정의 (reduce_mean 함수로 평균 계산) cost = tf.reduce_mean(tf.square(hypothesis - Y))


# 최적화를 위한 경사하강법 정의

optimizer = tf.train.GradientDescentOptimizer(learning_rate=1e-5)


# minimize 함수를 사용해 cost 함수의 최소값을 얻음 train = optimizer.minimize(cost)

# 세션을 생성하고 그래프의 모든 전역변수를 초기화 sess = tf.Session() sess.run(tf.global_variables_initializer())

# 그래프를 실행하고 feed_dict를 통해 실행 초기값을 입력함 for step in range(1001): cost_val, hy_val, _ = sess.run( [cost, hypothesis, train], feed_dict={X: x_data, Y: y_data} ) if step%200==0: print(step, "Cost: ", cost_val, "\nPrediction:\n", hy_val)

0 Cost: 8397.166 Prediction: [[169.02368] [165.52513] [160.76976] [130.99226] [146.38747]] 200 Cost: 93.65354 Prediction: [[254.29305] [260.94043] [245.62996] [218.28816] [246.3491 ]] 400 Cost: 53.146355 Prediction: [[251.37286] [260.50125] [243.09482] [221.05096] [249.46597]] 600 Cost: 31.487442 Prediction: [[249.10394] [260.2357 ] [241.52197] [222.79031] [251.7963 ]] 800 Cost: 19.353357 Prediction: [[247.3255 ] [260.0807 ] [240.56805] [223.86734] [253.5586 ]] 1000 Cost: 12.246923 Prediction: [[245.92062] [259.99527] [240.00885] [224.5187 ] [254.90598]]





#Reference

1) https://github.com/aymericdamien/TensorFlow-Examples/tree/master/tensorflow_v2

2) https://medium.com/@manjabogicevic/multiple-linear-regression-using-python-b99754591ac0

3) http://contents.kocw.net/document/ch5_6.pdf





[TensorFlow1.0] Multiple Linear Regression End

BioinformaticsAndMe





수강신청은 아래와 링크를 이용해주세요.


>> 수강신청 바로가기


CGI (Cancer Genome Interpreter) Start

BioinformaticsAndMe






CGI (Cancer Genome Interpreter)?


: CGI는 이미 검증된 암 변이 정보를 제공하고, 알려지지 않은 변이들의 Driver 가능성을 예측해주는 데이터베이스

: 다양한 임상 정보를 근거하여, 약물 반응성 유전체 바이오마커 정보를 제공

: 스페인 'IRB Barcelona'에서 관리

https://www.cancergenomeinterpreter.org/home




CGI 데이터


: CGI 홈페이지에서 'Cancer Biomarkers/Validated Oncogenic Mutations/Cancer Genes/Cancer Bioactivities' 항목으로 데이터 다운로드 가능

: 2019년 11월을 기준으로, CGI의 Cancer 바이오마커는 1,083개로 확인됨

: 2018년 초반 이후로는 업데이트가 멈춰있는 것으로 보임







#Reference

1) https://www.cancergenomeinterpreter.org/home

2) https://cancervariants.org/assets/docs/tutorials/CGI.pdf

3) https://blogs.biomedcentral.com/on-medicine/2018/03/29/introducing-the-cancer-genome-interpreter/




CGI (Cancer Genome Interpreter) End

BioinformaticsAndMe

원핵세포 구조 (Prokaryote structure) Start

BioinformaticsAndMe






1. Nucleoid (핵양체;핵상체)


: 원핵세포는 핵이 없으나, 유전물질인 DNA를 담고 있는 불규칙한 모양의 핵양체 부위 존재

: 원핵생물의 염색체는 일반적으로 원형의 Haploid(반수체) 형태를 보임

: 원핵생물 DNA는 NAPs(Nucleoid-associated proteins)과 함께 상호작용

*NAPs - 염색체의 조성 및 패키징에 관여하는 단백질




2. Plasmid (플라스미드)


: 세균의 유전체와 독립적으로 존재하는 원형의 DNA

: 성장에 필수적이지 않지만, 세균에 이점을 제공하는 유전자들이 존재

*일부 플라스미드는 항생제 내성을 갖는 유전자를 가짐

: 세포 내 오직 한개 사본만 있는 것부터, 수십개 사본으로 복제되는 것까지 다양함




3. Ribosome (리보솜)


: 단백질을 합성하는 리보솜은 'rRNA + 단백질'로 구성됨

*세포질에 존재는 리보솜 - 세포질 내에서 사용될 단백질 합성

*세포막에 부착된 리보솜 - 세포 밖으로 분비할 단백질 합성

: 원핵생물 → 30S + 50S = 70S

: 진핵생물 → 40S + 60S = 80S

*S - Svedberg unit, 침강 계수




4. Endospore (내생포자)


: 일부 세균은 불리한 환경을 견디도록 내생포자를 형성함

*열, 방사선 등에 내성

물질대사는 거의 일어나지 않음

고온 처리 시, 휴먼 상태의 내생포자가 발아



5. Plasma membrane (세포막;Cell membrane)


: 세포막은 세포질을 둘러싸고, 세포 내/외부 물질 흐름을 조절

: 인지질 이중층 또는 인지질 단일층 구조가 관찰됨




6. Cell wall (세포벽)


: 세포막 가장 바깥 쪽 위치하며, 원핵세포의 모양을 유지함

: 삼투 현상에 의해 세포가 터지지 않도록 보호




7. Capsule (협막)


: 원핵세포의 세포벽 밖에 위치한 다당류 성분으로 이루어진 보호층

: 조밀하게 짜여져 쉽게 씻겨나가지 않으며, 여러 질병의 원인이 됨



8. Pili (선모)


: 다른 박테리아 세포에 부착되는 세포 표면의 털 같은 구조

ㄱ. Fimbria(핌브리아) - 숙주 감염, 생물막 또는 콜로니 형성에서 부착에 사용

ㄴ. Sex pili(성선모) - 성선모로 다른 세균에 세포질 다리를 형성해, F플라스미드 사본을 전달함




9. Flagellum (편모)


: 편모는 세포벽을 뚫고 나온 길고 채찍 모양의 돌기

: 운동 부속 기관 역할로 세포 운동을 도움

*수소 농도 기울기를 통해, 프로펠러 회전 운동 수행






#Reference

1) https://courses.lumenlearning.com/microbiology/chapter/unique-characteristics-of-prokaryotic-cells/

2) https://www.thoughtco.com/prokaryotes-meaning-373369





원핵세포 구조 (Prokaryote structure) End

BioinformaticsAndMe



'Biology' 카테고리의 다른 글

마이크로RNA (miRNA)  (0) 2019.11.18
조직 (Tissue)  (0) 2019.11.12
여성 생식계 (Female reproductive system)  (0) 2019.11.01
남성 생식계 (Male reproductive system)  (0) 2019.11.01
바이러스 (Virus)  (0) 2019.10.27

[R] Excel 읽기/쓰기 Start

BioinformaticsAndMe






1. R xlsx 패키지 설치


: R에서 엑셀 데이터의 읽기/처리/쓰기 작업을 위해, 'xlsx' 패키지 설치

*참고로 엑셀 데이터를 처리하는 여러 R 패키지들이 존재 (xlsx, readxl, XLConnect 등)

# xlsx 패키지 install.packages("xlsx") library("xlsx")



2. Read an Excel file


: read.xlsx 함수를 사용하여, 엑셀 데이터 로딩

Expression_example.xlsx

# 예제 파일 경로 지정 후, 데이터 로딩 file <- 'Expression_example.xlsx' res <- read.xlsx(file, 1) # 첫번째 시트 읽기 res



3. Write data to an Excel file


: write.xlsx 함수를 사용하여, 엑셀 데이터 생성

# R 예제 데이터를 엑셀 형태로 파일 생성 write.xlsx(USArrests, file="myworkbook.xlsx",sheetName="USA Arrests")







#Reference

1) http://www.sthda.com/english/wiki/r-xlsx-package-a-quick-start-guide-to-manipulate-excel-files-in-r





[R] Excel 읽기/쓰기 End

BioinformaticsAndMe



'R' 카테고리의 다른 글

[R] 생존분석(Survival analysis)  (0) 2019.11.25
[R] 히스토그램(Histogram)  (0) 2019.11.18
[R] Merge  (0) 2019.10.30
[R] Heatmap 시각화  (4) 2019.10.24
[R] transform (데이터열생성 함수)  (0) 2019.10.17








한국생명공학연구원은 2019년 7월 차세대 한국인 유전체 분석지원센터 구축” 사업을 시작하고 유전체 정보 생산 기반과 더불어 방대한 유전체 정보를 분석하고 활용하는 시스템을 구축하고 있습니다이러한 유전체 정보 생산 및 분석 기반 구축과 더불어 국내 연구자들이 다양한 유전체 정보들을 잘 활용할 수 있도록 유전체 정보 분석 이론 및 실습을 위한 교육을 마련하였습니다본 교육은 1년에 2회 이상 이루어지며전장유전체전사체후성유전체단일세포 유전체, pathway 분석 등 다양한 오믹스 정보 분석에 꼭 필요한 최신 이론과 실습들을 포함하고 있습니다아무쪼록 본 교육을 통해 다양한 종류의 유전체 데이터에 대한 이해를 높이고 또 실습을 통해 분석 능력을 향상시키기를 기대하며관심 있는 분들의 많은 참여 부탁드립니다.

 

감사합니다.

 

2019년 11월 25

한국생명공학연구원

차세대 한국인 유전체분석지원센터





 

교육 일정

 

09:00 – 09:30 프로그램 설치 및 실습 기본 사항 안내

09:30 – 11:30 ChiP-seq 데이터 분석 이론 및 실습(박종열 박사)

11:30 – 13:00 점심 식사

13:00 – 15:00 단일세포 오믹스 분석 이론 및 실습(김종환 박사)

15:00 – 15:30 휴식

15:30 – 17:30 Gene-set 및 Pathway 데이터 분석 이론 및 실습(김선규 박사)

 

장소대전광역시 유성구 과학로 125 한국생명공학연구원 KOBIC동 3층 교육실

시간11월 25(오전 900분부터 오후 530분까지

등록(무료): 이메일 신청 (prosium@kribb.re.kr선착순 50)

준비물노트북 및 관련 프로그램 설치(별도 안내)

문의박승진(prosium@kribb.re.kr혹은 김선영(kimsy@kribb.re.kr)




+ Recent posts