#CJ제일제당 홈페이지

http://www.cj.co.kr/cj-kr/

항체 (Antibody) Start.

BioinformaticsAndMe




1. 항체 (Antibody) 정의

- 항원과 특이적 결합을 하여 항원-항체 반응을 일으키는 물질.

- 흔히 책에는 Y 모양으로 그림. 줄여서 Ab로 사용. 

- 포유류의 항체는 IgA, IgD, IgE, IgG, IgM 다섯 가지로 나뉨.






2. 항체 구조 (Structure)

- 항체는 불변 영역(Constant region)과 가변 영역(Variable region)으로 나뉨. 

- 가변 영역은 항원에 결합하고 불변 영역은 항체의 형상을 결정하는 데 쓰임.

- 또한 중사슬(Heavy chain)과 경사슬(Light chain)로도 구분.

- 중사슬은 가변 영역과 불변 영역에 존재하고, 경사슬은 가변 영역에만 존재. 






#참고문헌

1) https://namu.wiki/w/%ED%95%AD%EC%B2%B4






항체 (Antibody) End.

BioinformaticsAndMe

강화 학습(Reinforcement Learning) Start.

BioinformaticsAndMe





1) Reinforcement Learning (강화학습)

- 강화학습은 현재의 상태 (State)에서 어떤 행동 (Action)을 취하는 것이 최적인지 학습.
- 행동을 취할 때마다 외부 환경에서 보상 (Reward)이 주어지는데, 이러한 보상을 최대화 하는 방향으로 학습.





2) Reinforcement Learning 예시

- DQN Google DeepMind's Deep Q-learning playing Atari Breakout
- DDPG 심층 결정론적 정책 경사법 알고리즘




#참고 문헌

1) Libbrecht, M. W., & Noble, W. S. (2015). Machine learning applications in genetics and genomics. Nature Reviews Genetics, 16(6), 321.

2) https://ko.wikipedia.org/wiki/%EC%A7%80%EB%8F%84_%ED%95%99%EC%8A%B5

3) https://namu.wiki




강화 학습(Reinforcement Learning) End.

BioinformaticsAndMe



쇼그렌 증후군 (Sjogren's syndrome) Start.BioinformaticsAndMe

 

 

 

 

 

 

1. 쇼그렌 증후군 (Sjogren's syndrome) 

- 외분비샘의 기능저하로 인한 구강 건조 및 안구 건조 증상 이외에 전신을 침범할 수 있는 자가면역질환.

- 이 병명은 질환을 처음으로 기술한 스웨덴 의사 헨릭 쇼그렌의 이름을 따서 지어짐.

- 여자에서 남자보다 9배 정도 많이 발생하는데, 특히 30세에서 50세 사이의 중년 여자에서 호발.

- 관절염, 폐 침범, 신장 침범, 혈관염, 신경염, 그리고 악성 림프종 등이 발생할 수 있음.

- 특히, 악성 림프종의 발병률은 같은 나이, 성, 인종의 정상인과 비교 시 약 40배가 높음.

 

 

 

 

2. 쇼그렌 증후군 증상

ㄱ) 구강 건조

- 침샘의 장애로 침 분비가 저하되므로 씹고 삼키거나 말하는 것이 어려움.

ㄴ) 안구 건조

- 눈은 마르고 모래가 들어간 듯한 느낌. 충혈되어 빨갛게 보이기도 하고 광선에 예민해짐.

ㄷ) 침샘 부종

- 침샘은 혀 밑, 귀 앞의 뺨, 구강 뒤쪽에 위치. 쇼그렌 증후군에서는 이들 침샘 부위가 붓고 아프며 열이 발생.

ㄹ) 충치

- 세균에 대항하는 침 분비가 저하되면 쉽게 충치가 발생.

ㅁ) 비강, 목 건조 / 피부 건조 / 질 건조 / 피로감 / 관절염

 

 

 

 

3. 쇼그렌 증후군 원인

- 쇼그렌 증후군은 아직까지 그 원인이 명확하게 밝혀지지 않음.

- 그러나 여러 연구를 통해, 유전적인 원인, 바이러스 감염, 호르몬 이상 등이 관여되어 나타나는 자가면역질환이라 예상.

- 체내의 방어기전이 눈물, 침 등을 분비하는 분비샘을 파괴하여 쇼그렌 증후군을 일으킴.

 

 

 

 

 

 

#참고문헌

1) http://www.amc.seoul.kr/asan/healthinfo/disease/diseaseDetail.do?contentId=30815

2) https://ko.wikipedia.org/wiki/%EC%87%BC%EA%B7%B8%EB%A0%8C_%EC%A6%9D%ED%9B%84%EA%B5%B0

3) http://health.cdc.go.kr/health/mobileweb/content/group_view.jsp?CID=9AFA3F211D

 

 

 

 

 

 

쇼그렌 증후군 (Sjogren's syndrome) End.BioinformaticsAndMe

 

 

'Medicine > IME' 카테고리의 다른 글

골절 예방을 위한 비타민D + 칼슘  (0) 2022.10.10
갈색세포종 땀분비  (0) 2021.01.30
약물 투여 경로  (0) 2021.01.30
당뇨병 (Diabetes)  (0) 2019.11.14
당뇨합병증 검사 (Screening for Diabetes Complications)  (0) 2019.05.27

GWASdb (SNP annotation database) Start.

BioinformaticsAndMe






오늘은 쓸만한 GWAS SNP annotation 데이터베이스를 살펴보겠다.


GWASdb


GWASdb는 SNP Annoation 정보를 가진 거의 모든 Public db를 Curation했다 (아래 Table 참고).

GWASdb에서 Annotation된 SNP을 TASs(traits/diseases associated SNP) 라고 하는데, 수집에 사용한 기준이 다소 흥미롭다.

일반적으로 GWAS SNP p value 기준을 '5 x 10-8' 으로 잡고 결과를 리포팅하는데, GWASdb에서는 '1 x 10-3' 까지의 SNP들을 수집했다.

이것은 Phenotype에 연관된 SNP들의 N수를 광범위하게 늘려나가면서, 관련 GWAS 연구를 촉진시키기 위함이란다.


 SNP information Gene-based annotation Knowledge-based annotation Functional prediction Evolution annotation Disease annotation External link 
Annotations Manually curated (250k), dbSNP 142, 1000G phase I, HapMap and 1000G LD RefGene, EnsembleGene, KnownGene, GENCODE, Small RNA, MicroRNA target sites Validated and predicted enhancer, Insulator, HapMap and GTEx eQTL, Long range interaction (5C, ChIA-PET, Hi-C), ENCODE ChIP-seq, ENCODE functional elements Transcriptional factor binding site affinity, MicroRNA target site affinity, Splicing site affinity, Non-synonymous SNP functional prediction, Synonymous SNP functional prediction, Phosphorylation site functional prediction Positive selection, Conserved functional RNA, PhastCons, GERP++ elements OMIM, ClinVar, Cosmic, DGV, GAD SNPedia, Regulomedb, HaploReg, rSNPBase, UCSC Genome Browser, GWAS central 




그래서 총 수집한 TASs가 몇개인지 아래 bargraph에서 보인다.

Genic region에만 14만개 정도가 있으며, Intergenic까지 합치면 대략 25만개 TASs가 있다.







#GWASdb는 2011년, 처음으로 Nucleic Acids Research에 Publish했으며....



그 업데이트 버전(v2)를 2015년에 재차 publish 하였다.

(안타까운 점은 위 버전을 마지막으로, 16년부터는 지속적 업데이트는 없는 것으로 보인다)





개인적으로 생각하기에 GWASdb에서 가장 효율적으로 활용할 수 있는 정보는

Disease SNP 카테고리다.



예를 들어. 알츠하이머로 Curation된 모든 SNP 리스트를 보고 싶다면 쉽게 ctrl+F로 검색하여 찾을 수 있다.




마무리하며..

GWASdb는 현재 'GWASdb 2015 AUGUST release'가 마지막 버전이다.

아래 링크건 홈페이지에 'Services' 항목으로 가면 다운받을 수 있다.

흥미로운 점은 Drug 관련된 SNP 정보들도 정리해놨기 떄문에,

특정 약물에 관련된 TASs 리스트를 확인해볼 수 있겠다.




#GWASdb 홈페이지

http://147.8.193.36/gwasdb





GWASdb (SNP annotation database) End.

BioinformaticsAndMe

R, 파일 입출력 (FILE I/O) Start.

BioinformaticsAndMe






R, FILE I/O


일반적으로 R programming의 작업 환경은 내문서에서 시작된다.


# 현재 디렉토리 위치를 반환하는 함수

getwd() 


> getwd()

[1] "C:/Users/home/Documents"



# 현재 디렉토리 위치를 바꾸는 함수

setwd() 


setwd("C:/Users/home/Desktop")
> getwd()
[1] "C:/Users/home/Desktop"



# 파일 읽기 함수

read.table()


>Input_data <- read.table("test.txt", header=TRUE, sep="\t", na.strings=c(".","NA"))


"test.txt" : 파일이름

header=TRUE : 헤더가 있는 경우 헤더를 사용하며, 만약 header 파라미터를 넣지 않으면 모두 데이터로 인식.

sep=" " : 구분자가 탭(\t)dm로 인식되는 경우.

na.strings=c(".", "nA") : 파일로부터 읽어온 값이 '.' 또는 'NA'인 경우 '결측치, Not Available (NA)'로 인식.

 



# 파일 쓰기 함수

write.table()


>write.table("result.txt", sep=",", quote=F, row.names=F)


sep=“,“ : 컬럼의 구분자를 쉽표(,)를 사용.

quote=F : 출력되는 값들의 Double Quotation(“”)를 제거하고 출력.

row.names=F : 데이터의 rowname 출력 X.







R, 파일 입출력 (FILE I/O) End.

BioinformaticsAndMe

'R' 카테고리의 다른 글

R, as.Date (날짜 변환)  (0) 2019.06.03
pathview (패스웨이 분석)  (2) 2019.05.22
R, T-test (R, T검정)  (0) 2018.08.29
R plot (그래픽스)  (0) 2018.08.27
R 회귀분석 (R regression test)  (0) 2018.08.19

Teladoc (원격진료) Start.

BioinformaticsAndMe






Teladoc (원격진료)

2002년에 창립한 미국 Teladoc은 세계 최대의 telehealth company이다.

1000명 이상의 의료관련 전문가들이 대기하고 있으며, 1000만명 이상의 가입자를 보유하고 있다.

모바일, 인터넷 등을 통해 환자에게 맞춤형 원격진료를 제공하는 회사이다.




Teladoc은 알러지, 기관지염, 충혈과 같은 일반질환에 대해, 24시간 내내 의사와 소통할 수 있다.

또한, 이염(귓병) 질환같은 경우에 환자의 귀 속 상태를 의사가 화상으로 진찰함으로써, 그에 따른 처방을 받을 수 있다.





#Teladoc의 서비스 방식은 다음과 같다.

1) 환자가 Teladoc 사이트 혹은 전화를 통해 진료를 신청.

 

2. 평균 16분내에 의사가 연락해오며, 전화 혹은 온라인 비디오 서비스를 이용해 의사 진료.

 

3. 진료 내용은 Teladoc의 전자의무기록에 기록으로 남음.

 

4. (필요한 경우) 처방전이 발급.





#Teladoc 비즈니스 모델

- Teladoc은 'Business to Business to Customer' 사업을 가지고 있다.

- 기업, 보험회사가 Teladoc에 등록된 상태라면, 해당 직원들이 Teladoc 원격진료를 받고 그에 따른 비용을 기업, 보험회사가 지불한다.

- 미국 보험회사 'Aetna'가 보험가입자에게 Teladoc 서비스를 제공하는 대표회사이다.





#아래는 Teladoc 광고이다.





#미국내 원격진료 경쟁 업체로는 아래 5 곳이 있다.

- PlushCare, American Well, MDLIVE Inc, Doctor On Demand, Carena





#참고문헌

1) https://en.wikipedia.org/wiki/Teladoc

2) http://hif.co.kr/5196?cat=40

3) https://rctom.hbs.org/submission/ring-ring-the-edoctor-is-in/

4) http://www.yoonsupchoi.com/2015/07/16/teladoc_ipo/





Teladoc (원격진료) End.

BioinformaticsAndMe

[NGS Fusion] Fusion Tools Start.

BioinformaticsAndMe





NGS Fusion에서 사용되는 Tool들을 살펴보기 전에

Fusion read의 매핑 형태를 이해해야만 툴들의 특징을 이해하기 쉬울 것이다.


#Fusion read의 매핑 형태

Encompassing read: paired-end reads의 두 read 전체가 Fusion gene의 두 유전자에 각각 정렬된 것 (discordant).

Spanning read: single-end read 또는 paired-end reads 중 하나의 read가 fusion gene의 두 유전자에 일부분씩 정렬된 것 (split).





#아래 테이블이 NGS Fusion에서 흔하게 사용용되는 Computational Tools이다.

Method가 크게 'Fusion detection specific''Structural variant detection'으로 나뉘는데,

RNAseq 데이터의 Fusion 메카니즘에 기반한 것인지, 구조적 변이에 따라 Fusion을 정의한 것인지에 따른 것이다.

자세한 설명은 아래 포스팅을 참조하길 바란다.

http://bioinformaticsandme.tistory.com/73?category=808031

Others는 Denovo 방식으로 Fusion을 찾는 툴이다.


Method URL Feature
Fusion detection specific
BreakFusion http://bioinformatics.mdanderson.org/main/BreakFusion Identifying gene fusions from paired-end RNA-Seq data
ChimeraScan http://code.google.com/p/chimerascan/ Detecting fusion transcripts from RNA-Seq data
Comrad http://code.google.com/p/comrad/ Using both RNA-Seq and WGS data to detect genomic rearrangements and aberrant transcripts
FusionAnalyser http://www.ilte-cml.org/FusionAnalyser/ Detecting gene fusions from paired-end RNA-Seq data
deFuse http://sourceforge.net/apps/mediawiki/defuse/ Identifying gene fusions from RNA-Seq data
FusionMap http://www.omicsoft.com/fusionmap/ Using either WGS or RNA-Seq data to detect fusion genes
FusionHunter http://bioen-compbio.bioen.illinois.edu/FusionHunter/ Detecting fusion transcripts from RNA-Seq data
FusionSeq http://archive.gersteinlab.org/proj/rnaseq/fusionseq/ Identifying fusion transcript from RNA-Seq data
ShortFuse https://bitbucket.org/mckinsel/shortfuse Identifying fusion transcripts from RNA-Seq data
SnowShoes-FTD http://mayoresearch.mayo.edu/mayo/research/biostat/stand-alone-packages.cfm  Detecting fusion transcripts from RNA-Seq data
SOAPfusiona http://soap.genomics.org.cn/SOAPfusion.html Part of the software SOAP, for genome-wide detection of gene fusions from RNA-Seq data
TopHat-Fusion http://tophat-fusion.sourceforge.net/ An enhanced version of TopHat, for detection of fusion transcripts from RNA-Seq data
Structural variant detection
BreakDancer http://genome.wustl.edu/software/ Detecting structural variations from paired-end WGS data
CREST http://www.stjuderesearch.org/site/lab/zhang Identifying structural variations from paired-end
2003GASV http://code.google.com/p/gasv/ Software for identifying structural variations
HYDRA http://code.google.com/p/hydra-sv/ Detecting SVs in both unique and duplicated genomic regions
PEMer http://sv.gersteinlab.org/pemer/download.html Using paired-end NGS data to detect structural variation
R453Plus1Toolbox http://www.bioconductor.org/packages/2.10/bioc/html/R453Plus1Toolbox.html  An R/Bioconductor package for the analysis of Roche 454 sequencing data
SVDetect http://svdetect.sourceforge.net/Site/Home.html Detecting structural variations from paired-end/mate pair data
VariationHunter http://compbio.cs.sfu.ca/strvar.htm Identifying structural variations from paired-end WGS data
Others
R-SAP http://www.mcdonaldlab.biology.gatech.edu/r-sap.htm A parallel method to estimate RNA expression level and to detect gene fusions from RNA-Seq data
Trans-ABySS http://www.bcgsc.ca/platform/bioinfo/software/trans-abyss De novo assembly of RNA-Seq reads
Trinity http://trinityrnaseq.sourceforge.net/ De novo assembly of RNA-Seq without using a reference






#아래 표는 위에서 설명한 Fusion Tool들의 특징들을 설명했다 (본인이 보유한 데이터를 어떤 툴에 적용할 수 있을지 쉽게 구분지을 수 있다).

Format 부분에서 대부분 툴들이 Single-end를 지원하지 않는다.

Fusion 분석에서 single read로만 Fusion을 찾는 것은 split-read만 사용하므로 Detection 정도가 다소 떨어진다.





#아래 표는 Fusion Tool 각각에서 사용되는 매핑 툴과 파라미터를 설명했다.

본인이 사용한 툴에서 나온 Fusion gene들이 어떠한 기준으로 뽑혔는지 이해할 수 있다.

또한, 실험 환경에 따라 해당 파라미터를 조절하여 Fusion detection의 sensitivity와 specificity를 높일 수 있을 것이다.




#참고문헌

1) Wang, Q., Xia, J., Jia, P., Pao, W., & Zhao, Z. (2012). Application of next generation sequencing to human gene fusion detection: computational tools, features and perspectives. Briefings in bioinformatics, 14(4), 506-519.

2) Performance Improvement Analysis of Fusion Gene Detection Algorithms (한국통신학회 2015년도 추계종합학술발표회)





[NGS Fusion] Fusion Tools End.

BioinformaticsAndMe

'Bioinformatics Tool' 카테고리의 다른 글

[Cloud] BIO-Express  (0) 2019.05.23
[BLAST] BLAST result  (0) 2018.11.26
[NGS QC] MultiQC  (0) 2018.08.12
[Cytoscape] GeneMANIA 1  (0) 2018.07.22
[Driver Annotation] iCAGES  (0) 2018.07.13

2019년 정부 R&D예산, 사상 첫 20조원 돌파 Start.

BioinformaticsAndMe






2019년 정부 R&D예산, 사상 첫 20조원 돌파!

과기정통부 예산, 14.8조원 혁신성장에 집중 투입

데이터*AI 기반강화, 기초연구 강화, 미래 유망기술 육성, 일자리 창출 및 삶의 질 향상에 주력




http://ebrief.korea.kr/briefing/briefingDetailPopup.do?brpId=51134&gubun=G



2019년도 정부 R&D 예산안과 과기부 예산안은 향후 국회 예산 심사를 거쳐 최종 확정될 예정이며,

해당 포스팅에는 바이오/신약/빅데이터/인공지능 관련하여 추진될 사을 살펴보겠다.




1) 바이오․헬스 정밀의료 기술 개발 지원

A. 오믹스기반 정밀의료 기술개발사업 (19`예산: 60억)

- 당뇨, 자폐 등 난치성 질환 대상으로 다중오믹스 분석에 기반.

- 바이오마커 발굴 및 예측‧진단 기술개발의 난치성 질환 사업단 선정‧지원.


B. 혁신신약 파이프라인 발굴사업 (19`예산: 80억)

- 혁신신약 개발을 위한 후보물질 파이프라인 발굴을 목표로 사업단 구성 및 후보물질 단계의 우수한 신약 후보물질 선정.

- 학교·연구소 → 기업으로 이어지는 혁신신약 파이프라인 공급체계 구축.


C. 인공지능 신약개발 플랫폼 구축사업 (19`예산: 50억)

- 신약 후보물질 발굴부터 약물감시 등 신약개발 전 단계에 활용되는 인공지능 플랫폼의 부처간 공동 발굴을 목표.

- 데이터 확보 및 인공지능 솔루션 연구과제와 컨설팅 그룹 운영, 데이터 관리 등을 위한 지원 과제로 구성.





2) 데이터 구축유통 활성화

A. 빅데이터 플랫폼 및 네트워크 구축 (19`예산: 826억)

- 분야별(보건/의료 등) 데이터를 생산과 구축하는 빅데이터 센터 육성.

- 시장 수요에 맞게 데이터를 가공해 공급하는 빅데이터 플랫폼 구축 (데이터생태계).


B. 차세대인터넷비즈니스경쟁력강화(데이터구매/가공, 19`예산: 600억)

- 데이터거래 활성화와 데이터기반 기업 경쟁력을 높이기 위해, 벤처를 대상으로 데이터 구매·가공*비용을 지원.

- 데이터 바우처 지원사업 추진.





3) AI블록체인 핵심기술 개발 및 확산

A. 블록체인 활용기반 조성 (19`예산: 222억)

- 빅데이터 활용의 최적화를 위해, AI 핵심기술과 데이터 저장․거래의 보안과 신뢰성에 기반한 블록체인 기술개발 지원.


B. 인공지능 융합 선도프로젝트 (19`예산: 50억)

- AI 등 지능화 기술을 의료·제조·금융 등 다양한 산업에 접목하여 공공분야에 선도적으로 적용하는 실증 사업 확대 추진.






마무리하며..

2019년에 해당 예산과 관련하여 빅데이터 센터를 100개소 정도 선정할 예정이라 한다.

현재도 여러 빅데이터 센터가 있지만, 대부분 병원이나 기관에 치중되어 있는 상황인데,

민간기업에도 환경만 구축된다면 빅데이터 센터로 지정할 수 있다고 한다.

빅데이터 센터 개소로 국내에서 데이터 유통을 할 수 있을지?

한다면 어떤 방식으로 진행될런지 관심있게 지켜봐야겠다.





2019년 정부 R&D예산, 사상 첫 20조원 돌파 End.

BioinformaticsAndMe

비교유전체학 (Comparative genomics) Start.

BioinformaticsAndMe









1. 비교유전체학(Comparative genomics) 정의

- 인간 유전체 연구를 위해서 여러 생물종을 모델로 이용하여 인체 생명현상 및 질환을 연구.

- 서로 다른 생물 간의 유전체를 DNA 혹 PROTEIN수준에서 비교.





2. 형질에 영향을 주는 molecular mechanisms

- 이전의 진화모델은 Gene (mutation) 수준과 Population (selection) 수준으로 설명되었다.

- 더하여, 'biased embryos model'은 Organism 수준에서 developmental reprogramming의 4가지 진화방식을 설명한다.


heterochrony - change due to change in timing (유전자 발현의 타이밍 변형)

heterotopy - change in the position at which a character is expressed (위치적 발현양의 변형) 

heterometry - a change in quantity or degree of gene expression (유전자 발현 총량의 변형)

heterotypy - phenotypic change from one type to another (유전자에 의한 산물의 변형)





3. 유전자 상동성 (Homology)

- Homology : 어떠한 형질이 진화의 과정 동안 보존된 것을 말하며, 이는 형태적 형질이나 분자적 형질, 유전자 서열도 해당.

Ortholog : 한 개체가 진화되어 여러 종으로 분화되었을 때, 유전자의 기능이 그대로 보존되어 서로 유사한 기능을 수행하는 것을 의미.

 Speciation (종의 분화).

Paralog : 한 조상에서 온 유전자지만, 서열은 유사해도 기능이 좀 달라진 것들을 의미.

     Gene Duplication (유전자 중복).





4. dN/dS 분석

- dN/dS 분석 : Nonsynonymous 변이와 Synonymous 변이를 고려하여 진화속도 추정.

▶ Nonsynonymous (dN): 아미노산을 변형시키는 염기 돌연변이 (Selection-dependent).

▶ Synonymous (dS): 아미노산을 변형시키지 않는 염기 돌연변이 (Time-dependent).

▶ dN/dS > 1 : Positive selection, 기존 상태를 벗어나려 한다. 진화속도가 빠르다.

▶ dN/dS = 1 : Neutral selection, 중립적이다.

▶ dN/dS < 1 : Negative(Purifying) selection, 기존 상태를 유지하려 한다. 진화속도가 느리다. 


- 흔히, PAML (Phylogenetic Analysis by Maximum Likelihood)을 통해 dN/dS 계산한다.

- dN/dS 분석시, 시퀀스의 conservation이 어느 정도 높은 구간에서 사용하도록 권장한다. Conservation이 낮은 곳에서 분석되면 무의미한 variant에 의해 의미없는 dN/dS 값이 산출될 것이다.






#참고문헌

1) Epigenetic Regulation of Trinucleotide Repeat Expansions and Contrac-tions and the “Biased Embryos” Hypothesis for Rapid MorphologicalEvolution [accessed Sep 07 2018].

2) https://en.wikipedia.org/wiki/Ka/Ks_ratio.





비교유전체학 (Comparative genomics) End.

BioinformaticsAndMe

'Biology' 카테고리의 다른 글

박테리아 성장곡선 (Bacterial growth curve)  (0) 2019.09.21
항체 (Antibody)  (0) 2018.09.16
Genome Evolution (유전체진화)  (0) 2018.08.24
Gene Fusion (유전자융합)  (0) 2018.08.21
Evolution theory (진화론)  (0) 2018.08.03

+ Recent posts