[Python] 리스트(List) Start

BioinformaticsAndMe





1. Python List


: 파이썬 리스트는 순서를 가진 집합으로, 리스트는 대괄호( [ ] )로 선언됨

: 자유롭게 변경이 가능하며, 중복을 허용 

→ ['a', 'b', 'c', 'a']

# 리스트 thislist 출력

thislist = ["apple", "banana", "cherry"] print(thislist)

['apple', 'banana', 'cherry']



2. 리스트 Indexing


: 인덱스 번호를 통해, 리스트 항목에 접근할 수 있음

# 리스트의 Index1을 출력

thislist = ["apple", "banana", "cherry"] print(thislist[1])

banana

# 리스트의 Negative Indexing

thislist = ["apple", "banana", "cherry"] print(thislist[-1])

cherry



3. 리스트 Slicing


: 슬라이스 구문(':', 콜론)을 사용하여 문자열 일부를 리턴할 수 있음

: 첫번째 항목의 인덱스는 0

→ [start index]:[end index]

# Index2 ~ Index4 문자 슬라이싱 (Index5는 포함되지 않음)

thislist = ["apple", "banana", "cherry", "orange", "kiwi", "melon", "mango"] print(thislist[2:5])

['cherry', 'orange', 'kiwi']



4. 리스트 항목 변경


: 리스트의 특정 항목값을 변경하기 위해서, 인덱스 번호를 참조함

# 'banana'를 'blackcurrant'로 변경

thislist = ["apple", "banana", "cherry"] thislist[1] = "blackcurrant" print(thislist)

['apple', 'blackcurrant', 'cherry']



5. 리스트 항목 Check


: 특정 항목이 리스트 내에 존재하는지, 'in' 연산자를 사용해서 확인함

# 'apple'이 thislist에 존재하는지 확인 (존재한다면, 결과 출력)

thislist = ["apple", "banana", "cherry"] if "apple" in thislist: print("Yes, 'apple' is in the fruits list")

Yes, 'apple' is in the fruits list



6. 리스트 join


: 두 개의 리스트를 합치기 위해, 간단하게 '+' 연산자를 사용

# list1과 list2 리스트 값 합치기

list1 = ["a", "b" , "c"]

list2 = [1, 2, 3] list3 = list1 + list2 print(list3)

['a', 'b', 'c', 1, 2, 3]




파이썬 리스트 함수


함수

기능

실행

결과

append

리스트 끝에 항목 추가

fruits = ['apple', 'banana', 'cherry']

fruits.append("orange")

print(fruits)

['apple', 'banana', 'cherry', 'orange']

clear

리스트 모든 항목 제거

fruits = ["apple", "banana", "cherry"]

fruits.clear()

print(fruits)

[ ]

copy

리스트 복사

fruits = ["apple", "banana", "cherry"]

x = fruits.copy()

print(x)

['apple', 'banana', 'cherry']

count

리스트 내 특정 항목을 카운트

fruits = ["apple", "banana", "cherry"]

x = fruits.count("cherry")

print(x)

1

extend

리스트 끝에 다른 리스트 추가

fruits = ['apple', 'banana']

cars = ['Ford', 'BMW', 'Volvo']

fruits.extend(cars)

print(fruits)

['apple', 'banana', 'Ford', 'BMW', 'Volvo']

index

리스트 내 특정값의 첫번째 인덱스 리턴

fruits = ['apple', 'banana', 'cherry']

x = fruits.index("cherry")

print(x)

2

insert

리스트 내 특정 위치에 항목 추가

fruits = ['apple', 'banana', 'cherry']

fruits.insert(1, "orange")

print(fruits)

['apple', 'orange', 'banana', 'cherry']

pop

리스트 내 특정 위치 항목 제거

fruits = ['apple', 'banana', 'cherry']

fruits.pop(1)

print(fruits)

['apple', 'cherry']

remove

리스트 내 특정값을 갖는 항목 제거

fruits = ['apple', 'banana', 'cherry']

fruits.remove("banana")

print(fruits)

['apple', 'cherry']

reverse

리스트의 순서 뒤집기

fruits = ['apple', 'banana', 'cherry']

fruits.reverse()

print(fruits)

['cherry', 'banana', 'apple']

sort

 리스트 값 정렬

cars = ['Ford', 'BMW', 'Volvo']
cars.sort()
print(cars)

['BMW', 'Ford', 'Volvo']





#Reference

1) https://www.w3schools.com/python/python_lists.asp

2) https://realpython.com/python-lists-tuples/





[Python] 리스트(List) End

BioinformaticsAndMe

'Python' 카테고리의 다른 글

[Python] 파이썬 조건문  (0) 2019.11.21
[Python] 사전(Dictionary)  (0) 2019.11.05
[Python] 문자열(String)  (0) 2019.10.24
[Python] 연산자(Operator)  (0) 2019.10.18
[Python] 자료형(Data type)  (0) 2019.10.15

CIVIC (Clinical Interpretation of Variants in Cancer) Start

BioinformaticsAndMe






CIVIC?


: CIVIC(Clinical Interpretations of Variants in Cancer)은 오픈소스 커뮤니티 기반의 암 임상 변이 데이터베이스

: 여러 암들의 Somatic variant, Germline variant에 관련된 진단/치료/예후 정보 제공

: 암 변이에 대한 임상적 evidence를 제공하여, 정밀 의료 시대의 정확한 암 변이 해석을 추구

https://civicdb.org/home






CIVIC 데이터


: '2019년 10월 기준으로 암 관련 유전자 402개, 변이 2357개, Evidence 6467개 등의 데이터 보유

: CIVIC 데이터는 매일 업데이트되며, 매달 1일에 최종 업데이트된 CIVIC 데이터를 다운받을 수 있음

*물론, 매일 업데이트되는 정보도 'Nightly'라는 항목으로 다운받을 수 있음

: Public API 제공 → https://griffithlab.github.io/civic-api-docs/





CIVIC Evidence Level


: CIVIC Evidence Level은 임상적 유용성에 따라, A~E로 분류됨

1) Level A - 해당 변이는 의학계에서 검증됨

2) Level B - 해당 변이는 임상시험 또는 환자데이터 정보에 근거함

3) Level C - 해당 변이는 임상저널에서 보고된 경우가 있음

4) Level D - 해당 변이는 In vivo 또는 In vitro 연구에서 관련성이 있었음

5) Level E - 해당 변이는 간접적인 증거를 보임








#Reference

1) https://civicdb.org/home

2) https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5367263/




CIVIC (Clinical Interpretation of Variants in Cancer) End

BioinformaticsAndMe

'Public Database' 카테고리의 다른 글

KEGG pathway  (0) 2019.11.13
CGI (Cancer Genome Interpreter)  (0) 2019.11.06
GWAS Catalog  (0) 2019.10.23
OncoKB (Precision Oncology Knowledge Base)  (0) 2019.10.16
Clinvar (Clinically relevant variant)  (0) 2019.09.22

Feature selection vs Feature extraction Start

BioinformaticsAndMe






1. Feature selection (특징 선택)


: Feature selection(=Variable selection)은 관련없거나 중복되는 Feature들을 필터링하고 간결한 subset을 생성하는 과정

*Feature(특징) - 데이터 모델의 모든 입력 변수

: 대규모 변수를 가진 데이터에서 Feature selection은 차원 감소에 효과적

→머신 러닝 알고리즘의 Performance 향상

: Variance Thresholds(비지도학습) 또는 Genetic Algorithms(지도학습)에 사용됨





2. Feature extraction (특징 추출)


: Feature extraction은 기존 Feature들의 조합으로 유용한 Feature들을 새롭게 생성하는 과정

: 고차원의 원본 Feature 공간을 저차원의 새로운 Feature 공간으로 투영함

: PCA(비지도학습), LDA(지도학습)에 사용됨





3. Feature selection vs Feature extraction


: 데이터의 차원을 줄이기 위해, Feature selection(특징 선택) 및 Feature extraction(특징 추출) 과정을 진행할 수 있음

*Feature selection - 기존 Feature들의 부분 집합(하위 집단)을 유지

*Feature extraction - 기존 Feature에 기반하여 새로운 Feature들을 생성

: 수많은 변수가 있는 데이터셋에서, 적절한 Feature selection과 Feature extraction으로 오버피팅 방지 가능







#Reference

1) https://medium.com/@mehulved1503/feature-selection-and-feature-extraction-in-machine-learning-an-overview-57891c595e96

2) http://parnec.nuaa.edu.cn/jliu/FeatureExtraction.htm

3) https://benthamopen.com/FULLTEXT/TOBIOIJ-11-117

4) https://elitedatascience.com/dimensionality-reduction-algorithms#feature-selection

5) https://www.researchgate.net/publication/315807942_Affect_Measurement_A_Roadmap_Through_Approaches_Technologies_and_Data_Analysis

6) http://terryum.io/korean/2016/05/05/FeatureSelection_KOR/





Feature selection vs Feature extraction End

BioinformaticsAndMe

[DNA sequencing] 생어 염기서열 분석 Start

BioinformaticsAndMe






Sanger sequencing


: Sanger sequencing은 영국 생화학자 Fred Sanger(프레드 생어)와 그의 동료들이 1977년에 개발한 DNA 시퀀싱 방법

: 시험관 DNA 복제 중에 DNA 사슬을 종결시키는 'dideoxynucleotide termination method'에 기반

: 휴먼게놈프로젝트에서 상대적으로 작은 DNA 조각들을 시퀀싱하기 위해 사용됨

: 최근, NGS 분석으로 많이 대체 되었지만, 여전히 500bp 이상의 긴 염기서열 분석을 위해, cloning, PCR 분야 등에서 생어 시퀀싱 이용




Sanger sequencing 구성 요소


ㄱ) DNA template

→ 시퀀싱 될 DNA 주형

ㄴ) DNA 중합 효소(DNA polymerase enzyme)

→ DNA를 합성하며 연장해나감

ㄷ) 프라이머(Primer)

→ 방사성 표지 프라이머를 제작해, DNA Polymerase의 '스타터'로서 역할

ㄹ) 4개의 Deoxynucleotides(dNTP)

→ dATP, dTTP, dCTP, dGTP

ㅁ) 4개의 Dideoxynucleotides(ddNTP)

→ ddATP, ddTTP, ddCTP, ddGTP

→ ddNTP가 끼어들 때 복제를 멈추며, 다양한 길이의 DNA 가닥들이 합성됨







# 생어 시퀀싱 실험 영상







#Reference
1) https://www.khanacademy.org/science/high-school-biology/hs-molecular-genetics/hs-biotechnology/a/dna-sequencing
2) https://www.illumina.com/science/technology/next-generation-sequencing/ngs-vs-sanger-sequencing.html
3) https://ko.wikipedia.org/wiki/%EC%83%9D%EC%96%B4_%EC%97%BC%EA%B8%B0%EC%84%9C%EC%97%B4_%EB%B6%84%EC%84%9D
4) https://www.youtube.com/watch?v=FvHRio1yyhQ
5) https://terms.naver.com/entry.nhn?docId=5141512&cid=60266&categoryId=60266



[DNA sequencing] 생어 염기서열 분석 End

BioinformaticsAndMe

'Technology' 카테고리의 다른 글

[Cloning] 생명 복제  (0) 2019.11.13
[Mircoarray] DNA 미세배열  (0) 2019.11.05
[Western blotting] 웨스턴 블로팅  (0) 2019.10.22
[PCR] 중합효소 연쇄반응  (0) 2019.10.14
[Northern blotting] 노던 블로팅  (0) 2019.10.09

Z-검정 (Z-test) Start

BioinformaticsAndMe






Z-검정


: Z-검정은 정규분포를 가정하며, 추출된 표본이 동일 모집단에 속하는지 가설 검증하기 위해 사용

: Z-score는 '모집단 평균' 및 '모집단 표준 편차' 의 매개 변수를 이용해 계산

*Null hypothesis(귀무 가설) - 표본 평균이 모집단 평균과 같음

*Alternate hypothesis(대립 가설) - 표본 평균이 모집단 평균과 같지 않음

: Z 검정 통계량값이 임계값(Critical value)보다 크고 작음에 따라, 가설을 기각 또는 채택하게 됨




Z-검정을 사용할 때?


ㄱ) 표본 크기가 30보다 큼 (30이하라면 T-test 사용)

ㄴ) 데이터가 서로 독립적 (하나의 데이터가 다른 데이터에 영향을 미치지 않고, 관련되지 않음)

ㄷ) 데이터가 정규분포 (그러나, 30보다 큰 대규모 표본에서는 중요하지 않음)

ㄹ) 각각의 데이터는 모집단에서 동일한 확률로 선택되야 함

ㅁ) 비교 검정에서는 샘플크기가 가능한 같아야 함




One-proportion Z-검정 (R 예제)


One-proportion Z-검정은 '실제 측정 비율'이 '예상 이론 비율'과 일치하는지 비교하기 위해 사용

: 예제로, 수컷과 암컷의 비율이 50%로 균등한 쥐 집단에서, 추출된 160마리에서 각각 95마리 수컷과 65마리 암컷의 암발생을 확인함

→ 우리는 암발생이 수컷 쥐에서 더 빈번한지 통계적으로 알고 싶다

# prop.test 함수 사용 (binom.test 함수도 가능)

res <- prop.test(x = 95, n = 160, p = 0.5, correct = FALSE) res

1-sample proportions test without continuity correction data: 95 out of 160, null probability 0.5 X-squared = 5.625, df = 1, p-value = 0.01771 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.5163169 0.6667870 sample estimates: p 0.59375

: 검정 결과 p-value 값이 0.01771으로 유의 수준인 alpha = 0.05보다 작음

따라서, 암발생 쥐의 비율이 모집단 0.5 비율과 유의하게 다르다는 결론을 내림







#Reference

1) https://towardsdatascience.com/statistical-tests-when-to-use-which-704557554740

2) https://influentialpoints.com/Training/the-z_test.htm

3) https://www.statisticshowto.datasciencecentral.com/z-test/

4) https://getcalc.com/statistics-z-test-statistic-calculator.htm

5) http://cfa-studynotes.blogspot.com/2008/11/t-statistic-vs-z-statistic.html

6) http://www.sthda.com/english/wiki/one-proportion-z-test-in-r





Z-검정 (Z-test) End

BioinformaticsAndMe

'Statistics' 카테고리의 다른 글

생존 분석 (Survival analysis)  (1) 2019.11.25
분산 분석 (ANOVA)  (0) 2019.11.04
경향분석 (Cochran-Armitage Trend test)  (0) 2019.10.22
피셔정확검정 (Fisher exact test)  (0) 2019.10.15
1종, 2종 오류 (Type 1, 2 error)  (0) 2019.10.07

바이러스 (Virus) Start

BioinformaticsAndMe






1. 바이러스 (Virus)


: 질병을 일으키는 전염성 병원체 일종으로, 생물 중 유일하게 세포 형태를 갖지 못함

: 무생물과 생물의 경계에 놓여 있음

: 숙주 생물에 기생하는 의존적인 생명 유지 활동

: 유전물질의 핵산(DNA/RNA) 및 보호막의 단백질피막(Capsid)으로 구성

: 세균보다 작은 크기로 전자 현미경으로만 관찰됨

*크기: 진핵세포>세균>바이러스




2. 바이러스 특징


ㄱ) 숙주 감염 시, 숙주 내에서 생명 활동을 보임

*숙주 밖에서는 단순 단백질 결정체(Virion;비리온)

ㄴ) 바이러스 자체는 성장하지 않으나, 숙주 효소를 사용해 증식해나감

ㄷ) 세포 소기관들이 없고 세포막의 구조를 관찰할 수 없음

ㄹ) 자기복제가 가능해 돌연변이 발생

ㅁ) 유전, 적응 등의 생명 현상을 보임




3. 바이러스 분류


1) 핵산에 따른 분류

ㄱ) DNA바이러스: DNA가 유전물질인 바이러스

*Single-Stranded(SS) DNA 바이러스 - Picorna virus/Parvo virus

*Double-Stranded (DS) DNA 바이러스 - Adeno virus/Herpes virus

ㄴ) RNA바이러스: RNA가 유전물질인 바이러스

*Single-Stranded(SS) RNA 바이러스 - Polio virus/Rabies virus/Influenza virus/HIV/Hepatitis A

*Double-Stranded (DS) DNA 바이러스 - Reovirus


2) 숙주에 따른 분류

ㄱ) 세균성바이러스: 세균을 감염시키는 바이러스

*용균주기 또는 용원주기를 보임

*박테리오파지(Bacteriophage)

ㄴ) 동물성바이러스: 동물을 감염시키는 바이러스

*바이러스마다 다양한 방식으로 증식

*Influenza virus/Mumps virus/Rabies virus/Poliovirus/Herpes virus/HIV

ㄷ) 식물성바이러스: 식물을 감염시키는 바이러스

*세포 감염 시 원형질연락사(Plasmodesma)를 통해, 세포 사이를 이동하면서 식물 전체로 퍼짐

*Potato virus/Tobacco mosaic virus/Beet yellow virus/Turnip yellow virus/Cauliflower mosaic virus




4. 바이러스 측정법


ㄱ) PFU assay

PFU(Plaque forming unit): 단위 부피당 플라크를 형성하는 감염성 입자 수

세균 도말 배지들에 바이러스 용액을 단계적으로 희석해 뿌리고 배양했을 때, 배지에 생긴 플라크 수를 측정하여 바이러스 농도 추적


ㄴ) LD50

- LD50(Lethal dose for 50% kill): 숙주세포들 50%가 사멸하는 희석 농도 값

- 바이러스 용액을 단계적으로 희석해서 숙주세포들에 감염했을 때, LD50 값을 계산하여 바이러스 농도 추적

ㄷ) Hemagglutination assay

바이러스들은 적혈구와 응집하는 성질 존재

바이러스 용액을 단계적으로 희석해서 적혈구와 섞었을 때, 응집하는 최종 희석 농도값을 계산하여 바이러스 농도 추적

ㄹ) 직접 관찰법
라텍스 구슬을 바이러스 용액에 섞은 후, 전자현미경으로 직접 라텍스 구슬 수를 세서 바이러스 농도 추적






#Reference

1) https://byjus.com/biology/virus/

2) https://namu.wiki/w/%EB%B0%94%EC%9D%B4%EB%9F%AC%EC%8A%A4

3) https://askabiologist.asu.edu/explore/puzzling-pathogens

4) https://ko.wikipedia.org/wiki/%EB%B0%94%EC%9D%B4%EB%9F%AC%EC%8A%A4

5) https://courses.lumenlearning.com/boundless-microbiology/chapter/viral-replication/

6) https://www.thoughtco.com/plasmodesmata-the-bridge-to-somewhere-419216

7) http://www.virology.ws/2009/07/06/detecting-viruses-the-plaque-assay/




바이러스 (Virus) End

BioinformaticsAndMe



'Biology' 카테고리의 다른 글

여성 생식계 (Female reproductive system)  (0) 2019.11.01
남성 생식계 (Male reproductive system)  (0) 2019.11.01
암 (Cancer)  (0) 2019.10.24
Point mutation vs Frameshift mutation  (0) 2019.10.23
비타민 (Vitamin)  (0) 2019.10.17

#생물정보학 교육정보



유전체 정보분석 전문가 기본과정 I

Bioinformatics와 NGS 기술의 급격한 발전으로 인간 유전체 데이터에 기반한 개인 맞춤의학의 시대가 성큼 다가왔습니다. 임상 의료정보와 유전체 데이터의 통합분석에서 올바른 바이오-정보-의학적 도구 사용의 중요성은 아무리 강조해도 지나치지 않습니다.서울대학교병원 정밀의료 전문인력 양성과정에서는 급변하는 연구 환경에 대응하고, 유전체 데이터 기반의 맞춤의료 시대를 선도하는 유전체 임상 정보분석 전문가 양성을 위하여, 공개 소프트웨어인 R 통계 package와 Python 프로그래밍, 리눅스 환경 실습 및 유전체 자료분석으로 구성된 12일 간의 유전체 정보분석 전문가 기본과정I 수강생을 모집하오니 많은 지원을 바랍니다.


■ 일시 및 장소

일 시 : 2019년 12월 2() ~ 2019년 12월 17() 오전 9시 ~ 오후 6시(매주 평일)                   

장 소 : 서울대학교 의과대학
주 최 : 한국보건복지인력개발원
주 관 : 서울대학교병원
인 원 : 30명
등록비 : 등록비 무료 (강의교재 제공)


■ 교육대상

(1) 의료기관 및 공공기관, 연구중심병원, 유전체분석 업체 취업 희망자

(2) BT·IT 혹은 의학분야 전공 학부 졸업생, 관련 석·박사과정 및 학위 소지자

(3) 유전체 관련 기업, 연구소 등 창업 희망자



■ 지원절차

서류 전형 및 합격자 개별 통지

원서교부 및 접수기간 : 2019. 10. 25 ~ 2019. 11. 9

제출서류 : 아래 첨부한 지원서 양식을 다운로드 받아 일괄 작성하여 사무국에 제출

사무국 : 02-740-8854 송민주 (bdpm.office@gmail.com)

홈페이지 : http://bitec.snubi.org/course9.html

지원방법 : 이메일 혹은 직접 제출 (우편 접수 불가)

합격자 발표일시 : 2019.11.15. (예정)




실습 컴퓨터

가천홀에는 개인컴퓨터가 없으므로, 실습시 개인노트북 반드시 지참.

장 소 : 서울대 의학도서관3층 전산실습실(12/2,6,9,12,13,17),함춘회관 가천홀(12/3~5,10,11,16)

교 통 : 지하철 4호선 혜화역 3번 출구

주 차 : 주차권을 판매하지 않는 관계로 가급적 대중교통을 이용하시기 바랍니다.



■ 일정별 프로그램

시간

12/2 (월)12/3 (화)12/4 (수)12/5 (목)12/6 (금)

주제

오리엔테이션리눅스
프로그래밍
리눅스
프로그래밍
파이썬
프로그래밍
파이썬
프로그래밍

강사

김주한
(서울의대)
권영호
(서울여대)
권영호
(서울여대)
오지인
오지인

9:00~
9:30

Introduction
Linux Shell
Programming
Linux Server
Introduction to
Python
Application of
Python

9:40~
11:20

Orientation 1
Linux Operation
Linux Multitasking
and Cluster
Starting with
Python
Medical informatics
practice 1

11:30~
13:00

Orientation 2
Advanced
Programming
Linux LVM
Data structre of
Python
Medical informatics
practice 2

13:00~
14:00

중  식 

주제

리눅스
프로그래밍
리눅스
프로그래밍
리눅스
프로그래밍
파이썬
프로그래밍
파이썬
프로그래밍

강사

권영호
(서울여대)
권영호
(서울여대)
권영호
(서울여대)
오지인
오지인

14:00~
15:10

리눅스 개요 및 설치
Linux User and
Root
Linux Tuning
Functions of
Python
Defining Class

15:20~
16:30

Linux file system
Linux Permission
Linux Package and
Compile
Regular expression
Python Machine
Learning

16:40~
18:00

Editing with VI
Linux Internet,
Network
Linux Security
Bioinformatics
Practice
Python
visualization

시간

12/9 (월)12/10 (화)12/11 (수)12/12 (목)12/13 (금)

주제

R 통계학R 통계학
NGS 자료처리
NGS 자료처리
엑솜 및 전장
유전체

강사

김재환
(서울의대)
김재환
(서울의대)
박민영
(DNALink)
박민영
(DNALink)
신은순
(DNALink)

9:00~
9:30

Introduction
Machine learning algorithms for
biomedical informatics
Introduction of whole genome de
novo analysis
Overview
Intro to Germline
WGS/WES

9:40~
11:20

Starting with R
Microarray data
analysis 1
k-mer analysis (estimated genome
size) practice
PreProcessing
Germline Calling

11:30~
13:00

Data manipulation
with R
Microarray data
analysis 2
Genome assembly
practice 1
CellQCGermline filtering/
Annotation

13:00~
14:00

중  식 

주제

R 통계학R 통계학
NGS 자료처리
NGS 자료처리
엑솜 및 전장
유전체

강사

김재환
(서울의대)
김재환
(서울의대)
박민영
(DNALink)
박민영
(DNALink)
신은순
(DNALink)

14:00~
15:10

Statistical analysis
I
Classification using
R
Genome assembly
practice 2
PostProcessing1
Somatic calling

15:20~
16:30

Statistical analysis
II
Evaluation and
validation
Genome annotation
practice
PostProcessing2
Somatic Filtering/
Annotation

16:40~
18:00

Advanced R graphics and
ggplot2
Case study
Evolution analysis
practice
Interpretation
CNV

시간

12/16 (월)12/17 (화)

주제

전사체
후성유전체
전사체
후성유전체



강사

이승재
(DNALink)
이승재
(DNALink)



9:00~
9:30

Intro to RNA-Seq
analysis
Epigenomics 소개
biomedical informatics



9:40~
11:20

Set up Basic analysis
environment
Methyl seq 실습 1



11:30~
13:00

Reference mapping to
Genome
Methyl seq
실습 2



13:00~
14:00

중  식 

주제

전사체
후성유전체
전사체
후성유전체



강사

이승재
(DNALink)
이승재
(DNALink)



14:00~
15:10

Abundance
estimation
ChIP seq
실습 1



15:20~
16:30

Differential expressed genes
prediction
ChIP seq
실습 2



16:40~
18:00

Functional study
ChIP seq
실습 2





암 (Cancer) Start

BioinformaticsAndMe





1. 암(Cancer)


: 암의 정식 명칭은 악성종양(Malignant Tumor) 또는 악성신생물(Malignant neoplasm)이라 불림

: 다양한 이유로 증식/억제가 통제되지 않는 비정상적인 세포들이 과다하게 증식

: 주위 조직 및 장기에 침입하여 정상 조직 구조와 기능을 파괴해나감

: 국내 암 발생 1위는 위암(남자), 유방암(여자)




2. 암의 특징


ㄱ) 분열 조절이 되지 않아 무제한으로 증식함

ㄴ) 세포 밀도가 높아져도 억제되지 않음

ㄷ) 부착비의존성이 되어 세포 골격 모양이 흐트러짐

ㄹ) Angiogenesis(혈관신생) 환경 조성

ㅁ) 세포 고유의 성질을 잃어버리고, 탈분화 상태에 도달

ㅅ) TGF(Tumor Growth Factor)와 같은 인자들을 방출해 스스로 성장함

ㅇ) 주변 조직으로 침투 및 암전이

#Metastasis(암전이) 참고: https://bioinformaticsandme.tistory.com/20




3. 양성종양 vs 악성종양


 

양성종양(Benign tumor)

악성 종양(Malignant tumor)

성장속도

 -천천히 성장

 -성장이 멈추는 휴지기 존재

 -빠르게 성장

 -저절로 없어지는 경우 거의 없음

성장양식

 -한정된 범위로 성장

 -주변 조직으로 침윤 없음

 -주변 조직으로 침윤하여 성장

피막형성

 -피막에 싸여 주변 조직과 구분됨

 -경계가 뚜렷해 수술적 절제가 쉬움

 -피막이 없어 주위 조직 침윤이 잘 일어남

세포특성

 -세포 분화가 잘 되어 있음

 -성숙한 세포

 -고유 기능 유지

 -세포가 탈분화된 상태

 -미성숙한 세포

 -고유 기능 상실

인체영향

 -거의 영향 없음

 -대부분 매우 치명적

전이여부

 -혈관/림프관 침범이 없어 전이 거의 없음

 -혈관/림프관 침범으로 전신으로 전이 가능

재발여부

 -수술로 제거 후, 재발 거의 없음

 -전이로 인해 수술 제거가 어려워 재발

예후

 -좋음(생명 위협 x)

 -종양크기/림프점침범/전이유무에 따라 다름




4. 암의 원인


ㄱ) 유전자 손상

-원암유전자(Proto-oncogene) 파괴:  세포성장/분열/사멸/교정 신호 관련 유전자 손상

-암억제유전자(Tumor suppressor gene) 파괴:  p53, Rb(Retinoblastoma)와 같은 문지기 조절 유전자 손상


ㄴ) 암 유발 물질

-화학적 인자:  담배와 같은 발암 성분

-물리적 인자:  자외선/방사선의 광선류

-생물적 인자:  체내 호르몬 이상, 시토크롬해독


ㄷ) 암 바이러스

-세포가 바이러스에 감염되어 세포 주기 조절 인자들을 파괴

-암 바이러스는 암을 일으키는 설계도 RNA로 정상 세포 DNA에 결합하면 정상 세포는 암을 일으킴

-HPV(Human Papilloma Virus;인간유두종바이러스), RSV(Rous Sarcoma Virus;라우스육종바이러스)





5. 암의 치료


ㄱ) 수술:  진단적/근치적/예방적/완화적 수술

ㄴ) 항암화학요법:  세포 주기의 특정 단계를 저해

ㄷ) 방사선치료:  수선 능력이 약한 암세포 DNA 파괴

ㄹ) 조혈모세포이식:  공여자 조혈모세포를 환자에게 이식하여 조혈능력을 회복시킴






#Reference

1) https://namu.wiki/w/암

2) https://www.marycrowley.org/patients-and-family/cancer-basics/

3) https://www.cbnuh.or.kr/cbrcc/sub05/sub05_01.jsp

4) http://ncc.re.kr/webzine/201901/sub_05.jsp

5) http://www.kbccc.org/Controls/Main.aspx?d=02&g=HTML&c=0202

6) https://www.philpoteducation.com/mod/book/view.php?id=779&chapterid=1123#/

7) https://www.creative-bioarray.com/3D-Angiogenesis-Assay.htm

8) https://www.majordifferences.com/2013/08/difference-between-benign-and-malignant.html

9) https://www.whatisbiotechnology.org/index.php/exhibitions/sanger/cancer

10) https://ko.wikipedia.org/wiki/%EC%95%94

11) https://www.houstonmethodist.org/cancer/treatment-options/




암 (Cancer) End

BioinformaticsAndMe



'Biology' 카테고리의 다른 글

남성 생식계 (Male reproductive system)  (0) 2019.11.01
바이러스 (Virus)  (0) 2019.10.27
Point mutation vs Frameshift mutation  (0) 2019.10.23
비타민 (Vitamin)  (0) 2019.10.17
화학결합 (Chemical bond)  (0) 2019.10.17

[GenomeStudio] Genotyping module Start

BioinformaticsAndMe






GenomeStudio


: GenomeStudio는 Illumina array 데이터를 분석 및 시각화하도록 일루미나에서 제공하는 무료 프로그램

*2018년 이후,  version 2로 업데이트 된 상태로 아래 링크에서 다운받을 수 있음

https://support.illumina.com/downloads/genomestudio-2-0.html

: GenomeStudio에는 패키지처럼 생물정보학 분석에 필요한 다양한 모듈이 제공됨

*Genotyping, Expression, CNV, Methylation 등

: 누구나 쉽게 분석할 수 있도록 가벼운 인터페이스를 지님

: Illumina microarray raw data는 기본적으로 GenomeStudio로 분석됨

: 다만, 윈도우 환경에서만 프로그램이 제공되기에, 리눅스나 맥 작업 환경에서는 별도의 구축이 필요





Genotyping module


: 앞에서 설명한 것처럼 GenomeStudio 내에는 SNP genotype을 확인할 수 있는 Genotyping module이 존재

*microarray 발현양에 기반하여 유전자형을 동정

: 발현양에 기반하여 Copy Number Variation 동정도 가능

: 한번에 500만 개 이상의 probe를 분석할 수 있음

: Outlier(이상점) 샘플 추적 가능







#Reference

1) https://support.illumina.com/downloads/genomestudio-2-0.html

2) https://support.illumina.com/content/dam/illumina-support/documents/documentation/software_documentation/genomestudio/genomestudio-2-0/genomestudio-genotyping-module-v2-user-guide-11319113-01.pdf

3) https://www.illumina.com/techniques/microarrays/array-data-analysis-experimental-design/genomestudio.html

4) https://www.illumina.com/documents/products/datasheets/datasheet_genomestudio_software.pdf





[GenomeStudio] Genotyping module End

BioinformaticsAndMe

'Bioinformatics Tool' 카테고리의 다른 글

[Annotation] ANNOVAR  (1) 2019.10.30
[Methylation] RnBeads  (0) 2019.10.16
[Cloud] BIO-Express  (0) 2019.05.23
[BLAST] BLAST result  (0) 2018.11.26
[NGS Fusion] Fusion Tools  (0) 2018.09.09

[Python] 문자열(String) Start

BioinformaticsAndMe





Python String


: 파이썬 문자열은 작은따옴표(Single quotation) 또는 큰따옴표(Double quotation)로 둘러싸임

→ 'Hello' 또는 "Hello"

# 문자열 Hello 출력

print("Hello") print('Hello')

Hello

Hello



Assign String to a Variable


: 변수에 문자열을 할당하기 위해서는 'equal sign(=)'을 사용

# 문자열 Hello를 a 변수에 할당 후 출력

a = "Hello" print(a)

Hello



Python character array


: 파이썬 문자열은 문자의 요소들이 0번째부터 시작되는 배열을 이루고 있음

# 대괄호를 사용하여 문자열 요소에 접근

a = "Hello, World!" print(a[1])

e



Slicing


: 슬라이스 구문(':', 콜론)을 사용하여 문자열 일부를 리턴할 수 있음

→ [start index]:[end index]

# Index2 ~ Index4 문자 슬라이싱 (Index5는 포함되지 않음)

b = "Hello World" print(b[2:5])

llo



Negative Indexing


: 음수부호(-)를 사용하여 문자열을 끝에서부터 일부를 리턴할 수 있음

→ [-start index]:[-end index]

# -Index5 ~ -Index3 문자 슬라이싱 (-Index2는 포함되지 않음)

b = "Hello World" print(b[-5:-2])

Wor



String Concatenation


: 파이썬 문자열은 양수부호(+)를 사용하여 연결지을 수 있음

# 문자열 더하기

a = "Hello" b = "World"

print(a+b)

HelloWorld



String Length


: len() 함수를 사용하여 문자열의 길이(공백 포함)를 알 수 있음

# 문자열 길이 구하기

a = "Hello, World!" print(len(a))

13




파이썬 문자열 함수


함수

기능

실행

결과

strip

문자열 앞/뒤 공백 제거

a = " Hello, World! "

print(a.strip())

Hello, World!

lower

모든 대문자를 소문자로

a = "Hello, World!"

print(a.lower())

hello, world!

upper

모든 소문자를 대문자로

a = "Hello, World!"

print(a.upper())

HELLO, WORLD!

replace

문자열 치환

a = "Hello, World!"

print(a.replace("H", "J"))

Jello, World!

split

특정 구분자를 기준으로 문자열을 나눔

a = "Hello, World!"

b = a.split(",")

print(b)

['Hello', ' World!']

rsplit

특정 구분자를 기준으로 문자열을 나눔
*문자열 끝에서부터 split 수행

txt = "apple, banana, cherry"

x = txt.rsplit(", ")

print(x)

['apple', 'banana', 'cherry']

find

특정 문자가 처음 위치하는 index 찾기

txt = "Hello, welcome to my world"

x = txt.find("welcome")

print(x)

7

join

특정 구분자를 문자열 사이에 삽입

myTuple = ["John", "Peter", "Vicky"]

x = "#".join(myTuple)

print(x)

John#Peter#Vicky

count

특정 문자의 개수 세기

txt = "I apples, You apple"
x = txt.count("apples")
print(x)

1

startswith

문자열의 시작이 특정 문자인지 확인

txt = "Hello, welcome to my world."

x = txt.startswith("Hello")

print(x)

True





#Reference

1) https://www.w3schools.com/python/python_strings.asp

2) https://pythonspot.com/array-find/

3) https://netjs.blogspot.com/2019/07/string-slicing-in-python.html




[Python] 문자열(String) End

BioinformaticsAndMe

'Python' 카테고리의 다른 글

[Python] 사전(Dictionary)  (0) 2019.11.05
[Python] 리스트(List)  (0) 2019.10.30
[Python] 연산자(Operator)  (0) 2019.10.18
[Python] 자료형(Data type)  (0) 2019.10.15
[Python] 주석 처리  (0) 2019.10.15

+ Recent posts