[R] p value 보정 Start

BioinformaticsAndMe






P value 보정 (본페로니, FDR)


# Raw p value pvals = c(.001, .002, .003, .01, .02, .05, .22, .59, .87, .88) # Bonferroni correction BONF = p.adjust(pvals, "bonferroni") # FDR (False discovery rate) FDR = p.adjust(pvals, "fdr")

# 결과 비교를 위한 데이터프레임 생성 res = data.frame(pvals=pvals, BONF=round(BONF, 3), FDR=round(FDR, 3)) res



#FDR 보정 과정 참고

https://bioinformaticsandme.tistory.com/129






[R] p value 보정 End

BioinformaticsAndMe

'R' 카테고리의 다른 글

[R] transform (데이터열생성 함수)  (0) 2019.10.17
[R] subset (데이터추출 함수)  (0) 2019.10.17
[R Shiny] 샤이니 소개  (0) 2019.10.06
Hierarchical clustering (R 계층적 군집화)  (0) 2019.10.04
K-medoids clustering (R PAM)  (0) 2019.09.30

[PCR] 중합효소 연쇄반응 Start

BioinformaticsAndMe








1. Polymerase Chain Reaction (중합효소 연쇄반응)


: Polymerase Chain Reaction(PCR)은 타겟 DNA 부분을 복제하고 증폭시키는 분자생물학 기술

: 지극히 미량의 DNA 용액에서 연구자가 원하는 특정 DNA 단편을 대량으로 증폭하는 실험법

: DNA 복제 과정을 시험관에서 구현 가능

: 범죄 혈흔, 멸종 생물, 희귀질환 분석 등에 활용





2. PCR 구성 요소


ㄱ) Taq DNA polymerase(Taq 중합효소): Thermophilus aquaticus에서 추출된 고온 내성의 DNA 합성효소

ㄴ) Primer(프라이머): DNA 복제가 시작되도록 3`-OH를 제공하는 상보적인 외가닥의 DNA  (DNA 프라이머)

ㄷ) dNTP: 3개의 인산이 결합된 Deoxyribonucleotide로 DNA 합성의 재료 (dATP,dTTP,dGTP,dCTP)

ㄹ) Buffer(완충용액): 효소 활성에 필요한 물질 제공

ㅁ) DNA: 증폭하려는 DNA (이중가닥, 외가닥 모두 가능)





3. PCR 과정


1) Denaturing(변성): 이중가닥DNA를 외가닥DNA로 벌림 (94~95도)

2) Annealing(결합): DNA 프라이머를 상보적 외가닥서열에 붙임 (50~56도)

    재결합온도가 결합 특이성 커짐

    GC contents가 50% 정도의 프라이머를 사용하는 것이 바람직

    두 프라이머가 재결합하는 온도를 같게 해야 함

3) Extending(신장): 새로운 DNA 가닥을 합성 (72도)

    모든 과정을 보통 20∼40회 반복하면서 타겟하는 DNA 부분을 증폭함





4. PCR 활용


a. 선택적 유전자 증폭

- 특정 DNA 부분을 증폭시킴으로써 DNA 조각을 분리

- 작은 DNA 조각으로 대량 DNA조각들을 얻을 수 있어 DNA 클로닝에 이용


b. DNA의 증폭과 정량화

- 타겟 증폭으로 극미량 샘플의 DNA 서열 파악 가능

- 고대 맘모스 등의 오래된 DNA 정량화 가능


c. 질병의 진단

- 백혈병이나 겸상적혈구빈혈증의 진단에서 특정 악성 세포 위치를 정확히 파악 가능







# PCR 실험 영상









#Reference
1) https://ko.wikipedia.org/wiki/%EC%A4%91%ED%95%A9%ED%9A%A8%EC%86%8C_%EC%97%B0%EC%87%84_%EB%B0%98%EC%9D%91
2) https://namu.wiki/w/PCR
3) https://socratic.org/questions/how-is-the-polymerase-chain-reaction-useful-in-dna-fingerprinting
4) https://www.pinterest.co.kr/pin/308285536990020283/
5) https://www.yourgenome.org/facts/what-is-pcr-polymerase-chain-reaction
6) http://www.biologydiscussion.com/biotechnology/molecular-basis-of-disease-diagnosis-and-treatment-with-diagram/17514




[PCR] 중합효소 연쇄반응 End

BioinformaticsAndMe

'Technology' 카테고리의 다른 글

[DNA sequencing] 생어 염기서열 분석  (0) 2019.10.28
[Western blotting] 웨스턴 블로팅  (0) 2019.10.22
[Northern blotting] 노던 블로팅  (0) 2019.10.09
[Southern blotting] 서던 블로팅  (0) 2019.10.01
[Genotyping] SNP Array  (0) 2019.09.25

#생물정보학 교육정보


ABO식 혈액형 (ABO blood group) Start

BioinformaticsAndMe








ABO식 혈액형?


: ABO식 혈액형은 카를 란트슈타이너가 발견한 혈액형 구분법 (1901년, 오스트리아) 

: 적혈구 막에 있는 응집원을 기준으로 A형, B형, AB형, O형으로 분류 

: 사람의 혈액을 섞었을 때 일어나는 응집 반응으로 항원 항체 반응의 결과





혈액형 판정


: 각 혈액형에서 응집원이 어떤 응집소와 응집 반응을 일으키는가로 혈액형을 판정

: 응집원과 응집소가 항원 항체 반응 수행

*응집원 - 적혈구 막에 있는 항원으로 작용하는 부분

*응집소 - 혈장에 있는 항체


: 항 A 혈청에는 B형인 사람의 혈청의 응집소 α가 있으므로 B형 표준혈청이라 명명
: 항 B 혈청에는 A형인 사람의 혈청의 응집소 β가 있으므로 A형 표준혈청이라 명명
*A형 → 항A혈청[B형표준혈청](양성),  항B혈청[A형표준혈청](음성)

*B형 → 항A혈청[B형표준혈청](음성),  항B혈청[A형표준혈청](양성)

*AB형 → 항A혈청[B형표준혈청](양성),  항B혈청[A형표준혈청](양성)

*O형 → 항A혈청[B형표준혈청](음성),  항B혈청[A형표준혈청](음성)






혈액형 수혈


: 같은 혈액형 사이에서는 다량 수혈 가능

: 서로 다른 혈액형은 공여자 적혈구와 수여자 항체가 서로 응집되지 않을 경우에만 소량 수혈 가능

*O형은 모든 혈액형에게 공여 가능, AB형은 모든 혈액형으로부터 수여 가능 (A→AB, B→AB 방향도 가능)

*B형(공여자)→AB형(수여자): B형의 α항체가 AB형의 A응집원과 응집되나, α항체의 농도가 낮아 이상반응 x

*AB형(공여자)→B형(수여자): AB형의 A응집원에 의해 수여자 면역계가 활성화되므로, α항체를 계속 생산하여 응집반응 발생




복대립 유전


: ABO식 혈액형은 복대립 유전 (한 좌위에 세 개 이상의 대립 유전자[A,B,O]가 존재)

*우열관계:  A = B(공동우성) > O(열성)

: 적혈구 세포막 밴드 3 단백질과 스핑고지질에 결합한 당 구조 차이





ABO식 혈액형 관련 유전자의 이상


ㄱ) cis-AB형

- 희귀 혈액형으로 호남 및 일본 규슈 지역을 제외한 다른 나라에는 없는 혈액형

- 혈액형이 AB형인 사람의 A와 B 유전자가 모두 하나의 염색체 안에 들어 있는 비정형 AB형

- O형과 결혼해 아이를 낳더라도 AB형 또는 O형이 나타남


ㄴ) 봄베이 표현형

- Oh형이라하며, 인도 봄베이에서 발견된 것을 유래

- 푸코오스 전달효소 활성이 없는 h 대립 유전자가 생김

- 항A혈청, 항B혈청 모두가 응집 반응을 못해 O형처럼 보임








#Reference

1) https://namu.wiki/w/ABO%EC%8B%9D%20%ED%98%88%EC%95%A1%ED%98%95

2) http://study.zum.com/book/13399

3) https://ko.wikipedia.org/wiki/ABO%EC%8B%9D_%ED%98%88%EC%95%A1%ED%98%95

4) https://www.scienceall.com/abo%EC%8B%9D-%ED%98%88%EC%95%A1%ED%98%95abo-type-blood-group-2/

5) https://sites.google.com/site/padraigmcdowelln9738142/evidence-for

6) https://genetics.thetech.org/ask-a-geneticist/codominant-traits-people

7) http://www.donga.com/news/View?gid=8550673&date=20080303

8) https://blood.ca/en/research/our-research-stories/research-education-discovery/abcs-abo-blood-types

9) https://terms.naver.com/entry.nhn?docId=1232837&cid=40942&categoryId=32310

10) https://terms.naver.com/entry.nhn?docId=2691878&cid=60261&categoryId=60261




ABO식 혈액형 (ABO blood group) End

BioinformaticsAndMe


'Biology' 카테고리의 다른 글

비타민 (Vitamin)  (0) 2019.10.17
화학결합 (Chemical bond)  (0) 2019.10.17
세포핵 (Cellular nucleus)  (0) 2019.10.08
눈의 구조 (Human Eye Anatomy)  (0) 2019.10.03
하디-바인베르크 평형 (Hardy-Weinberg equilibrium)  (0) 2019.09.27

[TensorFlow] Linear Regression Start

BioinformaticsAndMe










[TensorFlow] Logistic Regression


: TensorFlow 2.0 에서 수행되는 로지스틱 회귀분석 과정

: MNIST 데이터베이스 (Modified National Institute of Standards and Technology database)의 '0~9 손글씨' 데이터 사용

→ 60,000개의 Training 이미지 및 10,000개의 Testing 이미지 포함

→ 각 MINST 이미지 크기는 28x28 픽셀이며, 픽셀 하나는 0~255 사이의 숫자값(density)을 가짐

: 이 예제 과정에서 각 이미지는 1) float32로 변환,  2) 784개 feature(28x28)의 1차원 배열화,  3) [0, 1]로 표준화 수행


# '__future__' : python 2에서 python 3 문법 사용 가능

from __future__ import absolute_import, division, print_function

# 텐서플로우, 넘파이 라이브러리 임포트 import tensorflow as tf import numpy as np

# MNIST 데이터셋 파라미터 설정

num_classes = 10 # 0에서부터 9까지 숫자 종류 num_features = 784 # 28*28 = 784

# 학습 파라미터 설정 learning_rate = 0.01 training_steps = 1000 batch_size = 256

display_step = 50

# MNIST 데이터 로딩 from tensorflow.keras.datasets import mnist (x_train, y_train), (x_test, y_test) = mnist.load_data() # 파이썬 튜플 자료형으로 데이터 저장

# 1) float32로 변환 x_train, x_test = np.array(x_train, np.float32), np.array(x_test, np.float32) # 2) 이미지 포맷을 28*28=784 픽셀의 1차원 배열로 변환 x_train, x_test = x_train.reshape([-1, num_features]), x_test.reshape([-1, num_features]) # 3) 255을 나누어 [0, 1] 값으로 표준화 x_train, x_test = x_train / 255., x_test / 255.

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
11493376/11490434 [==============================] - 1s 0us/step

# tf.data API를 사용하여 데이터 셔플링 및 배치화 train_data = tf.data.Dataset.from_tensor_slices((x_train, y_train)) train_data = train_data.repeat().shuffle(5000).batch(batch_size).prefetch(1)

# Weight matrix 생성을 위해, 총 784*10개의 weights 필요 W = tf.Variable(tf.ones([num_features, num_classes]), name="weight")

b = tf.Variable(tf.zeros([num_classes]), name="bias") # 로지스틱 회귀식 (Wx + b) 정의 def logistic_regression(x): # softmax 함수 적용 return tf.nn.softmax(tf.matmul(x, W) + b) # Cross Entropy 손실 함수 정의 def cross_entropy(y_pred, y_true): # one hot vector 인코딩 (텍스트를 유의한 벡터로 변환하는 방법론) y_true = tf.one_hot(y_true, depth=num_classes) # log(0) error를 피함 y_pred = tf.clip_by_value(y_pred, 1e-9, 1.) # Cross Entropy 계산 return tf.reduce_mean(-tf.reduce_sum(y_true * tf.math.log(y_pred))) # 정확도 척도 정의 def accuracy(y_pred, y_true): # 예측 클래스는 예측 벡터에서 가장 높은 스코어 인덱스

correct_prediction = tf.equal(tf.argmax(y_pred, 1), tf.cast(y_true, tf.int64)) return tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) # Stochastic Gradient Descent (SGD;확률적경사하강법) 알고리즘 optimizer = tf.optimizers.SGD(learning_rate)

# 학습 알고리즘 최적화 과정 def run_optimization(x, y): # 텐서플로우는 자동 미분(주어진 입력 변수에 대한 연산의 gradient를 계산하는 것)을 위한 tf.GradientTape 함수 사용 with tf.GradientTape() as g: pred = logistic_regression(x) loss = cross_entropy(pred, y) # gradients 계산 gradients = g.gradient(loss, [W, b]) # gradients에 따라 Weight(W)와 bias(b) 업데이트 optimizer.apply_gradients(zip(gradients, [W, b]))

# 주어진 스텝에 맞춰 training 시작 for step, (batch_x, batch_y) in enumerate(train_data.take(training_steps), 1): # Weight(W)와 bias(b) 업데이트를 위해 사전 정의된 최적화 과정 실행 run_optimization(batch_x, batch_y)

# display_step(50, 100, 150...)에서 적용 중인 파라미터값 출력 if step % display_step == 0: pred = logistic_regression(batch_x) loss = cross_entropy(pred, batch_y) acc = accuracy(pred, batch_y) print("step: %i, loss: %f, accuracy: %f" % (step, loss, acc))

step: 50, loss: 666.254395, accuracy: 0.765625 step: 100, loss: 515.914062, accuracy: 0.828125 step: 150, loss: 614.817017, accuracy: 0.832031 step: 200, loss: 620.690918, accuracy: 0.820312 step: 250, loss: 520.586487, accuracy: 0.867188 step: 300, loss: 580.417847, accuracy: 0.871094 step: 350, loss: 484.761322, accuracy: 0.839844 step: 400, loss: 621.492798, accuracy: 0.820312 step: 450, loss: 791.947632, accuracy: 0.820312 step: 500, loss: 616.336060, accuracy: 0.828125 step: 550, loss: 645.748718, accuracy: 0.851562 step: 600, loss: 732.390259, accuracy: 0.761719 step: 650, loss: 631.023621, accuracy: 0.832031 step: 700, loss: 74.979805, accuracy: 0.914062 step: 750, loss: 48.739697, accuracy: 0.941406 step: 800, loss: 70.699936, accuracy: 0.910156 step: 850, loss: 60.746632, accuracy: 0.937500 step: 900, loss: 57.646683, accuracy: 0.937500 step: 950, loss: 95.919128, accuracy: 0.890625 step: 1000, loss: 72.987892, accuracy: 0.929688

# 테스트 셋을 사용해 훈련된 모델의 정확도 측정 pred = logistic_regression(x_test) print("Test Accuracy: %f" % accuracy(pred, y_test))

Test Accuracy: 0.913800

# 예측 결과 시각화 import matplotlib.pyplot as plt


# 훈련된 모델에서 5개 이미지 예측 n_images = 5 test_images = x_test[:n_images] predictions = logistic_regression(test_images) # 이미지 결과 시각화 및 모델 예측 for i in range(n_images): plt.imshow(np.reshape(test_images[i], [28, 28]), cmap='gray') plt.show() print("Model prediction: %i" % np.argmax(predictions.numpy()[i]))


Model prediction: 7
Model prediction: 2
Model prediction: 1
Model prediction: 0
Model prediction: 4



#참고 - [TensorFlow] 원-핫 인코딩(One-hot encoding)

: 원-핫 인코딩은 표현하고 싶은 단어 인덱스에 1을, 다른 인덱스에는 0을 부여하는 단어의 벡터 표현 방식

(1) 각 단어에 고유한 인덱스를 부여 (정수 인코딩)

(2) 표현하고 싶은 단어의 인덱스 위치에 1을 부여하고, 다른 단어의 인덱스의 위치에 0을 부여






#Reference

1) https://github.com/aymericdamien/TensorFlow-Examples/tree/master/tensorflow_v2

2) http://yann.lecun.com/exdb/mnist/

3) https://ko.wikipedia.org/wiki/MNIST_%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4

4) https://mmlind.github.io/Simple_1-Layer_Neural_Network_for_MNIST_Handwriting_Recognition/

5) https://wikidocs.net/22647





[TensorFlow] Logistic Regression End

BioinformaticsAndMe

'Machine Learning' 카테고리의 다른 글

K-NN(최근접이웃) 알고리즘  (0) 2019.10.23
랜덤포레스트(Random Forest)  (1) 2019.10.17
[TensorFlow] Linear Regression  (0) 2019.10.05
[TensorFlow] 기본 연산  (0) 2019.10.04
[TensorFlow] 문자열 출력  (0) 2019.10.03

[Northern blotting] 노던 블로팅 Start

BioinformaticsAndMe






Northern blot (노던 블롯)


: 겔 전기영동으로 분획된 RNA 단편을 membrane에 옮긴 후, 특정 염기서열을 지닌 단편을 검출하는 기술

: 노던 블롯은 서던 블롯과 유사한 이름으로 명명(1977) 

→ 이름이 의미하는 동서남북 방향과 관계 없음

→ 서던 블롯을 응용해 특정 mRNA 발현 정도를 찾아내는 방법이었기에 유사하게 명명

: 분자 생물학에서 시료의 특정 RNA(mRNA) 동정으로 유전자 발현을 연구하는 방법

: 샘플에서 특정 mRNA 서열의 존재 여부, 양, 절편 크기 등을 확인 가능







Northern blot 실험 과정


1. 세포들에서 RNA 분리

2. RNA를 변성시켜 단일가닥으로 유지하기 위해 포름알데히드(formaldehyde) 처리

3. 탐침과 RNA가 결합 온도를 낮추기 위해 포름아미드(formamide) 처리

*탐침과 RNA가 결합할 때 온도가 높으면 불안정한 RNA는 쉽게 분해

4. 추출한 RNA를 아가로스(Agarose) 겔에 전기영동 한 후, RNA 조각을 크기 별로 분리

5. 모세관 현상으로 겔에서 NC(Nitrocellulose) 필터로 RNA 전이

6. NC 필터에 자외선을 쪼여 핵산과 NC 필터 사이에 교차 결합을 형성

7. 탐지하고자 하는 RNA와 상보적인 단일나선 DNA or RNA 탐침(probe) 제조

*probe: 방사선동위원소나 효소, 혹은 발광 및 발색 반응할 수 있는 핵산조각

8. 여과지와 탐침을 충분한 시간동안 혼성화 진행

*탐침은 자신과 상보적인 염기서열을 가진 RNA에 결합

*혼성화(hybridization): 염색체에 탐침 DNA를 부착시키는 과정

9. X선 필름에 여과지를 감광시켜 특정 RNA 존재 확인






# 노던 블로팅 실험 영상








#Reference
1) https://www.researchgate.net/figure/General-schematic-of-Northern-blotting_fig1_318305214
2) https://ko.wikipedia.org/wiki/%EB%85%B8%EB%8D%98_%EB%B8%94%EB%9E%8F
3) https://terms.naver.com/entry.nhn?docId=5569294&cid=61233&categoryId=61233
4) https://www.youtube.com/watch?v=zfvihIzYyAc




[Northern blotting] 노던 블로팅 End

BioinformaticsAndMe

'Technology' 카테고리의 다른 글

[Western blotting] 웨스턴 블로팅  (0) 2019.10.22
[PCR] 중합효소 연쇄반응  (0) 2019.10.14
[Southern blotting] 서던 블로팅  (0) 2019.10.01
[Genotyping] SNP Array  (0) 2019.09.25
[NGS] Epigenetic sequencing  (0) 2019.05.26

세포핵 (Cellular nucleus) Start

BioinformaticsAndMe







세포핵(Cellular nucleus)?


: 진핵생물의 진핵세포에 존재하며 세포 내 유전정보인 선형 DNA의 대부분을 가짐

: 리보솜 조립의 장소로 단백질 합성을 조절하여 세포의 활동을 조절

: 공 모양 또는 타원 모양의 형태로 지름이 20~30μ 정도의 크기

: 세포마다 한 개의 핵을 지님 (단, 적혈구는 핵이 없음)






세포 핵 구조


1. Nucleoplasm(핵질, 핵원형질)

핵 내부를 채우고 있는 불용성 물질

- RNA와 여러 종류 단백질(가수분해효소 등)을 포함

- 히스톤 단백질에 감긴 선형 DNA들에 유전 정보들이 나뉘어 존재



2. Nucleolus(인, 핵소체)

막 경계가 없으며, 리보솜 RNA(rRNA)가 합성되는 장소

- 단백질 합성이 활발한 세포에는 인의 수가 많으며, 현미경으로 더 까맣게 보임

- 세포 분열 사이에 있는 간기의 핵에서 관찰된 후, 세포 분열기에 사라짐



3. Nuclear envelope(핵막, nuclear membrane)

핵을 둘러싸 모양을 유지한채로 세포질과 구별되게 함

- 인지질 이중층의 2중막 구조이며, 일부 소포체가 연결 됨

- 핵막에는 다수의 핵공이 존재



4. Nuclear pore(핵공)

핵과 세포질 사이의 물질 출입 조절

- 작은 분자들이나 이온은 핵공을 통해 이동 (50kDa 이하 물질)

- 핵공은 약 100개의 서로 다른 단백질로 이루어짐






#Reference

1) https://ko.wikipedia.org/wiki/%EC%95%84%EB%82%98%EC%BD%98%EB%8B%A4_(%ED%8C%8C%EC%9D%B4%EC%8D%AC_%EB%B0%B0%ED%8F%AC%ED%8C%90)

2) https://namu.wiki/w/%EC%84%B8%ED%8F%AC%ED%95%B5

3) https://ko.wikipedia.org/wiki/%EC%84%B8%ED%8F%AC%ED%95%B5

4) https://en.wikipedia.org/wiki/Cell_nucleus

5) http://study.zum.com/book/13732

6) https://ko.wikipedia.org/wiki/%ED%95%B5%EA%B3%B5




세포핵 (Cellular nucleus) End

BioinformaticsAndMe

Anaconda 설치 Start

BioinformaticsAndMe






Anaconda?


: 아나콘다(Anaconda)는 데이터 과학, 빅데이터 처리, 머신러닝 분석 등을 위한 파이썬 및 R의 자유-오픈 소스 배포판

: Conda라는 패키지 관리 시스템으로 관리되며, 윈도우/리눅스/macOS에 적합한 1,400개 이상의 데이터 분석 패키지를 포함 (Numpy, Pandas 등)

: 파이썬 입문자들에게 추천되나, 설치 시간이 오래 걸림

: 아나콘다 설치를 위해선 https://www.anaconda.com/ 에서 본인 OS에 맞는 프로그램을 다운받아 설치






1. Anaconda 다운로드


: 본인의 OS에 맞게 다운 (https://www.anaconda.com/distribution/#download-section)

 해당 설치 과정은 윈도우 10 기준으로 진행함

: 3.x 버전에서 주로 개발과 업데이트가 이루어짐

→ 따라서 지금 파이썬에 입문한다면, 3.x 버전을 설치하는 것이 유리




2. 접근 권한


: 사용자 환경에 따라 권한 설정




3. 설치 경로


: 사용자 환경에 따라 권한 설정




4. 환경 설정


: Add Anaconda to my PATH environment variable

→ 사용자 환경에 따라 권한 설정

: Register Anaconda as my default Python 3.7

→ 아나콘다를 파이썬 3.7로 등록




5. 설치 완료


: Anaconda Prompt 검색된다면 설치 끝




6. 파이썬 실행


: Anaconda Prompt 실행 후, python 입력







#Reference

1) https://ko.wikipedia.org/wiki/%EC%95%84%EB%82%98%EC%BD%98%EB%8B%A4_(%ED%8C%8C%EC%9D%B4%EC%8D%AC_%EB%B0%B0%ED%8F%AC%ED%8C%90)

2) https://namu.wiki/w/Python

3) https://realpython.com/python-windows-machine-learning-setup/

4) https://www.anaconda.com/enterprise/

5) https://www.slideshare.net/continuumio/distributed-computing-on-your-cluster-with-anaconda-webinar-2015




Anaconda 설치 End

BioinformaticsAndMe

'Python' 카테고리의 다른 글

[Python] 자료형(Data type)  (0) 2019.10.15
[Python] 주석 처리  (0) 2019.10.15
Python JSON  (0) 2019.10.02
Python API  (0) 2019.09.30
Variable (Python 변수)  (0) 2019.09.25

#생물정보학 교육정보




   유전체 정보분석 전문가 기본과정 II

Bioinformatics와 NGS 기술의 급격한 발전으로 인간 유전체 데이터에 기반한 개인 맞춤의학의 시대가 성큼다가왔습니다. 임상 의료정보와 유전체 데이터의 통합분석에서 올바른 바이오-정보-의학적 도구 사용의 중요성은 아무리 강조해도 지나치지 않습니다.
서울대학교병원 정밀의료 전문인력 양성과정에서는 급변하는 연구 환경에 대응하고, 유전체 데이터 기반의 맞춤의료 시대를 선도하는 유전체 임상 정보분석 전문가 양성을 위하여, 공개 소프트웨어인 R 통계 package와 Python 프로그래밍, 리눅스 환경 실습 및 유전체 자료분석으로 구성된 매주 토요일 총 12주 간의 유전체 정보분석 전문가 기본과정II 수강생을 모집하오니 많은 지원을 바랍니다.


■ 일시 및 장소


일 시 : 2019년 11월 2() ~ 2020년 1월 18() 오전 9시 ~ 오후 6시(매주 토요일)                   

장 소 : 서울대학교 의과대학
주 최 : 한국보건복지인력개발원
주 관 : 서울대학교병원
인 원 : 30명
등록비 : 등록비 무료 (강의교재 제공)

■ 일정별 프로그램

시간

11/2 (토)11/9 (토)11/16 (토)11/23 (토)11/30 (토)

주제

오리엔테이션리눅스
프로그래밍
리눅스
프로그래밍
파이썬
프로그래밍
파이썬
프로그래밍

강사

김주한
(서울의대)
권영호
(서울여대)
권영호
(서울여대)
오지인
오지인

9:00~
9:30

Introduction
Linux Shell
Programming
Linux Server
Introduction to
Python
Application of
Python

9:40~
11:20

Orientation 1
Linux Operation
Linux Multitasking
and Cluster
Starting with
Python
Medical informatics
practice 1

11:30~
13:00

Orientation 2
Advanced
Programming
Linux LVM
Data structre of
Python
Medical informatics
practice 2

13:00~
14:00

중  식 

주제

리눅스
프로그래밍
리눅스
프로그래밍
리눅스
프로그래밍
파이썬
프로그래밍
파이썬
프로그래밍

강사

권영호
(서울여대)
권영호
(서울여대)
권영호
(서울여대)
오지인
오지인

14:00~
15:10

리눅스 개요 및 설치
Linux User and
Root
Linux Tuning
Functions of
Python
Defining Class

15:20~
16:30

Linux file system
Linux Permission
Linux Package and
Compile
Regular expression
Python Machine
Learning

16:40~
18:00

Editing with VI
Linux Internet,
Network
Linux Security
Bioinformatics
Practice
Python
visualization

시간

12/7 (토)12/14 (토)12/21 (토)12/28 (토)1/4 (토)

주제

R 통계학R 통계학
NGS 자료처리
NGS 자료처리
엑솜 및 전장
유전체

강사

김재환
(서울의대)
김재환
(서울의대)
박민영
(DNALink)
박민영
(DNALink)
신은순
(DNALink)

9:00~
9:30

Introduction
Machine learning algorithms for
biomedical informatics
Introduction of whole genome de
novo analysis
Overview
Intro to Germline
WGS/WES

9:40~
11:20

Starting with R
Microarray data
analysis 1
k-mer analysis (estimated genome
size) practice
PreProcessing
Germline Calling

11:30~
13:00

Data manipulation
with R
Microarray data
analysis 2
Genome assembly
practice 1
CellQCGermline filtering/
Annotation

13:00~
14:00

중  식 

주제

R 통계학R 통계학
NGS 자료처리
NGS 자료처리
엑솜 및 전장
유전체

강사

김재환
(서울의대)
김재환
(서울의대)
박민영
(DNALink)
박민영
(DNALink)
신은순
(DNALink)

14:00~
15:10

Statistical analysis
I
Classification using
R
Genome assembly
practice 2
PostProcessing1
Somatic calling

15:20~
16:30

Statistical analysis
II
Evaluation and
validation
Genome annotation
practice
PostProcessing2
Somatic Filtering/
Annotation

16:40~
18:00

Advanced R graphics and
ggplot2
Case study
Evolution analysis
practice
Interpretation
CNV

시간

1/11 (토)1/18 (토)

주제

전사체
후성유전체
전사체
후성유전체



강사

이승재
(DNALink)
이승재
(DNALink)



9:00~
9:30

Intro to RNA-Seq
analysis
Epigenomics 소개
biomedical informatics



9:40~
11:20

Set up Basic analysis
environment
Methyl seq 실습 1



11:30~
13:00

Reference mapping to
Genome
Methyl seq
실습 2



13:00~
14:00

중  식 

주제

전사체
후성유전체
전사체
후성유전체



강사

이승재
(DNALink)
이승재
(DNALink)



14:00~
15:10

Abundance
estimation
ChIP seq
실습 1



15:20~
16:30

Differential expressed genes
prediction
ChIP seq
실습 2



16:40~
18:00

Functional study
ChIP seq
실습 2




  • 교육대상:

    (1) BT·IT 혹은 의학분야 전공 학부 졸업생, 관련 석·박사과정 및 학위 소지자
    (2) 의료기관 및 공공기관, 연구중심병원, 유전체분석 업체 취업 희망자
    (3) 유전체 관련 기업, 연구소 등 재직자 및 창업 (준비)자

  • 지원절차:

    서류 전형 및 합격자 개별 통지
    원서교부 및 접수기간 : 2019. 9. 24 ~ 2019. 10. 15
    제출서류 : 아래 첨부한 지원서 양식을 다운로드 받아 일괄 작성하여 사무국에 제출
    사무국 : 02-740-8854 송민주 (bdpm.office@gmail.com)
    홈페이지 : http://bitec.snubi.org/course10.html
    지원방법 : 이메일 혹은 직접 제출 (우편 접수 불가)
    합격자 발표일시 : 2019.10.20. (예정)


  • #생물정보학 교육정보






    RNA-Seq 데이터분석 무료 워크샵 일정 안내

    대상자 : RNA-Seq 고객 및 국내 연구자

    참석인원 제한 : 최대 15명 이내, 신청시 Lab.당 2명 이내

    2019년 4분기 워크샵 일정 : 10월 18일 오전(금), 11월 15일(금), 12월 20일(금)




    [신청방법 및 세부사항]


      - 신청방법 : 신청서 작성후 이메일로 신청

      - 신청서 다운로드(http://www.e-biogen.com/board_notice.php?act=view&aid=289)

      - 워크샵 시간 : 오전 9시 또는 오후 1시(약 3시간 소요)

      - 장소 : (주)이바이오젠 본사

      - 준비사항 : 노트북(마우스 포함)




    [워크샵 교육내용]


    - Part 1 -

    ExDEGA(Excel based DEG anaysis)

    ExDEGA GraphicPlus(DAVID)

    KEGG Mapper(Search-Color Pathway)

    - Part 2 -

    ExDEGA GraphicPlus(Clustering)

    MExDEGA GraphicPlus(PCA)

    Cytoscape-String app(PPI Network)


     


    [분석워크샵 문의]


     - 02-3141-0791, service@e-biogen.com

     


    + Recent posts