R, RStudio 설치 Start.

BioinformaticsAndMe



오픈소스 통계 프로그래밍 언어 R

R 통합개발 분석 환경 (IDE, Integrated Development Environment)인 RStudio 설치를 해보자.


1. R 설치

R은 Windows, MAC OS X, Linux 환경 모두에서 설치 가능하다. 여기서는 Window를 기준으로 설치를 진행한다.

R을 설치하려면 아래 보이는 공식사이트(https://www.r-project.org/)에서 R소프트웨어를 다운로드 한다. 
현재 최신버전은 3.5.1 (2018년07월02일) 이다.

아래의 download R을 클릭하면 R을 설치할 수 있는 Mirror 사이트로 연결된다. 





Mirror 사이트의 모습이다.
해당되는 국가 미러사이트에서 받는게 속도가 빠르다.




Window용을 클릭한 뒤 하위폴더에에서 install R for the first time을 선택하면 다운로드가 페이지가 뜬다.

여기서 Download R 3.5.1. for Windows를 클릭하면 다운로드 창이 보인다.

(나머지 과정은 생략하겠다.. 사진이 너무 많아..)


2. RStudio 설치

RStudio는 코드 직접실행, 구문강조, 괄호 자동입력지원, 명령어 완성, 다양한 단축키, 데이터 보기 및 가져오기, 그래픽 조작, 프로젝트 관리, 버전 관리 등의 다양한 기능을 제공한다. RStudio를 설치하기 위해서 RStudio 홈페이지로 이동한다. 

https://www.rstudio.com/


공식홈페이지에서 Download RStudio를 누르자.



클릭해서 들어가면 처음에 무슨 달러 써있고 이래서 놀랄 수 있는데, 가볍게 지나치고

스크롤을 내리면 아래 같은 화면이 나오고 해당 OS에 맞게 설치해주면 끝난다.


모든 설치가 끝나면 4개의 영역으로 구성된 RStudio를 볼 수 있겠다.

1. 소스 편집기 및 데이터view

2. R 콘솔

3. 작업환경과 히스토리

4. 파일, 플롯, 패키지, 도움말




R, RStudio 설치 End.

BioinformaticsAndMe

'R' 카테고리의 다른 글

R, Command line interface Ⅱ  (0) 2018.07.20
R, Command line interface Ⅰ  (0) 2018.07.16
Permutation test (순열검정법)  (7) 2018.07.08
Cogena-2 (CoExpression 분석)  (0) 2018.07.06
Cogena-1 (CoExpression 분석)  (0) 2018.07.05

[Driver Annotation] iCAGES Start.

BioinformaticsAndMe



Cancer genomics 분석으로 Somatic mutation(체세포 돌연변이) 나왔을때, 그 변이가 해당암에서 Driver 역할을 하는지 알고싶다.

그래서 연구자들은 MuSiC, SIFT, FunSeq2 등의 프로그램들을 개발해왔고, Cancer에서 Driver variant 혹은 gene을 찾아 결과를 냈다.

오늘 소개할 툴은 이와 같은 맥락으로 만들어진

iCAGES (integrated CAncer GEnome Score for comprehensively prioritizing driver genes in personal cancer genomes) 를 다뤄보겠다.

iCAGES 는 coding, noncoding, structure 변이의 기여도를 종합하여, 분석으로 확인된 변이 및 유전자의 우선 순위를 메기고,

기존의 연구된 biological knowledge를 기반으로 driver gene을 찾는다. 최종적으로는, Driver gene들의 Drug treatment 까지 고려하여

우선 순위의 약물을 제시하는 플랫폼이 되겠다.



아래는 Driver gene 을 찾는 여러 툴들 간의 비교 테이블이다.

큰 카테고리로 Genomic variant analysis, Transcriptomic expression analysis, Phosphorylation analysis 의 3개로 나눠져있다.

MuSiC이나 SIFT같은 이미 많이 알려진 툴들이 보인다.

iCAGES 기능 중 Personalized drug, Prior knowledge integration 가 눈에 띄는데,

Personalized drug 은 특정 환자에서 나온 변이에 대해 Drug prioritization 을 해준다는 것이고,

Prior knowledge integration 은 Phenolyzer(database-mining tool)을 이용해 기존 관련 연구 내용을 스코어링해 prioritization을 돕는다는 것으로 보인다.



#iCAGES 의 파이프라인은 크게 3개의 layer를 가지고 분석이 진행된다.

Layer 1: Variant prioritization

첫 번째 layer는 돌연변이를 먼저, 여러 툴로 annotation한다. 그리고 coding, noncoding, SV 에서 각각 prioritization 스코어를 얻고 표준화시킨다.


Layer 2: Gene prioritization

두 번째 layer 는 모든 유전자 변이에 대한 점수를 위에서 전달받고, 몇몇 알고리즘을 거쳐 각 유전자에 대한 iCAGES score를 얻는다 (암유전자일수록 높은 스코어를 가질 가능성이 높다).


Layer 3: Drug prioritization

iCAGES의 마지막 단계는 표적 약물의 우선 순위를 정한다. 앞에서 받은 유전자를 DGIdb와 FDA Drug db에 쿼리하여, 해당 유전자가 Driver gene이 될 수있는지 표적으로 삼는 모든 potential drug을 찾고 스코어링 한다.




http://icages.wglab.org

iCAGES 논문에서는 위 사진처럼 웹에서도 쉽게 사용할 수 있다고해서 가봤더니, 안된다; 웹서버가 안된지 꽤 된 것으로 보인다..

하지만 아래 사이트엑 가면, iCAGES 다운로드와 튜토리얼을 친절하게 제공해주고 있으니 참고하면 좋겠다.

#iCAGES 다운 및 설치

http://boevalab.com/ONCOCNV/http://icages.openbioinformatics.org/en/latest/



마무리하며...

암유전체뿐만아니라 많은 연구에서 Driver gene을 찾는데 많은 노력을 기울이고 있다.

다양한 데이터베이스와 알고리즘이 알려져 있는데, iCAGES 툴을 공부하다 보면 어느정도 흐름이 보인다.

Drive gene 찾는 연구 초기에 분석을 어떤식으로 진행할지 막막하다면,

iCAGES 를 사용하면서 어떤 논리와 기준으로 스코어링을 메겨 Driver gene과 variant를 찾는지 봐두면 좋겠다.


iCAGES 논문

https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-016-0390-0#Tab1




[Driver Annotation] iCAGES End.

BioinformaticsAndMe

'Bioinformatics Tool' 카테고리의 다른 글

[BLAST] BLAST result  (0) 2018.11.26
[NGS Fusion] Fusion Tools  (0) 2018.09.09
[NGS QC] MultiQC  (0) 2018.08.12
[Cytoscape] GeneMANIA 1  (0) 2018.07.22
[CNV] ONCOCNV  (0) 2018.07.08

1. 지원 자격요건

국가공무원법 제33조의 결격사유가 없는 자

남자의 경우 병역을 필한 자(군면제 포함)로 해외여행에 결격사유가 없는 자

 

2. 공통 우대사항

「국가유공자 등 예우 및 지원에 관한 법률」등의 국가보훈대상자

 국가보훈처에서 「취업지원대상자증명서」를 반드시 발급받아 제출(공고일 기준 발급)

「장애인고용촉진 및 직업재활법」에 의한 장애인

 

3. 채용분야(중복지원 불가능)

공통사항

고용계약 : 임용일로부터 1 

(※업무수행 능력 우수자에 한하여 매년 재계약 가능)

영어능력 연구직의 경우 영어 논문작성 및 학회발표 등 영어능력이

필수적이므로 일정수준 이상의 영어점수(동등자격요구.

 

. 채용 세부내용

응시분야

응시직급 
및 코드

자격요건 및 수행직무

채용

예정인원

기업지원

연구개발
업무

선임연구원
(
응시코드A1)

 학위 및 경력

박사학위 소지자 혹은 석사학위 취득후 연구경력 4

상자로서 단백질 관련 기업 업무 및 사업화업무 경험

 전공분야 : 생명과학및 산업정책 분야

 영어 : 토익 기준 700점 이상 또는 동등 자격자

O

 수행 내용

기업지원 연구개발 총괄 운영

본 센터 관련 기업 육성 지원

본 센터 관련 기업 종합 지원 체계 구축

산학연 연계 협의체 운영

기술사업화 및 투자연계 지원 업무

신규 전략 사업 발굴 및 추진

 우대 사항

관련 정부기관기업체경제 기관단체 등에서 3년 이상 경력자

 급여수준 : (경력에따라 결정년봉 5,000 만원 내외

 채용기간 : 임용일로부터 1

 업무수행 능력 우수자에 한하여 매년 재계약 가능

단백질

공통기술

연구개발

업무

(유전자

클로닝,

단백질

발현)

선임

연구원

(응시코드

A2)

박사후

연구원

(응시

코드

B2)

 학위 및 경력

선임 연구원박사학위후 3년 이상 연구경험자

박사후 연구원박사학위 소지자

 전공분야 : 분자세포생물학생화학단백질체학 등 관련 분야

 영어 : 토익 기준 700점 이상 또는 동등 자격자

O

 수행 내용

재조합 유전자 발현을 위한 벡터 디자인클로닝 및

단백질 발현

조합 유전자와 단백질의 기능 검증 및 메카니즘 규명

유전자 클로닝 및 단백질 발현 관련 공통 기술 개발

단백질 실험실 공통 장비 운용

 우대 사항

고급 클로닝 기술 경험자

FACS NGS 활용 경험자,

 급여수준: (경력에따라 결정)

선임연구원년봉 5,000 만원 내외

박사후연구원년봉 3,600 만원 내외

 채용기간 : 임용일로부터 1

※연구(업무)수행 능력 우수자에 한하여 매년 재계약 가능

단백질

고급정제

재조합기술

연구개발

업무

(단백질 정제정량화)

선임

연구원

(응시코드

A3)

박사후

연구원

(응시

코드

B3)

 학위 및 경력

선임 연구원박사학위후 3년 이상 연구경험자

박사후 연구원박사학위 소지자

 전공분야 : 분자세포생물학생화학단백질체학 등 

관련 분야

 영어 : 토익 기준 700점 이상 또는 동등 자격자

O

 수행 내용

단백질 고급 정제 업무

단백질 발현정제 관련 고급 기술 개발

단백질 생화학적 활성분석

단백질 Q/C 고급 기술 개발

단백질 생화학 실험실 장비 운용

 우대 사항

온적정열량측정장비(ITC), 표면플라즈몬분광기(SPR) 등을 이용한 단백질간의 상호작용 분석 경험질량분석기(MS) 사용 단백질 분석 경험

 급여수준 : (경력에따라 결정)

선임연구원년봉 5,000 만원 내외

박사후연구원년봉 3,600 만원 내외

 채용기간 : 임용일로부터 1

※연구(업무)수행 능력 우수자에 한하여 매년 재계약 가능

슈퍼컴퓨팅을

이용한

단백질디자인

연구개발

업무

선임

연구원

(응시코드

A4)

박사후

연구원

(응시

코드

B4)

 학위 및 경력

선임연구원박사학위후 3년 이상 연구경험자

박사후 연구원박사학위 소지자

 전공분야 : 계산 구조생물학계산 생물물리학

생명 정보학단백질, DNA 등의 계산과학 등 관련 분야

 영어 : 토익 기준 700점 이상 또는 동등 자격자

O

 수행 내용

단백질 구조 슈퍼컴퓨팅 계산열역학적 안정성 계산

단백질-단백질단백질-DNA 상호작용 계산

유전체 및 단백질 정보학

단백질 구조 빅데이터 Classifier  predictor 디자인 등

 우대 사항

단백질 구조 슈퍼컴퓨팅 분자동역학 연구 경험자

단백질 구조 빅데이터 연구 경험자

 급여수준 : (경력에따라 결정)

선임연구원년봉 5,000 만원 내외

박사후연구원년봉 3,600 만원 내외

 채용기간 : 임용일로부터 1

※연구(업무)수행 능력 우수자에 한하여 매년 재계약 가능

 

4. 영어 동등자격자 인정기준

1) 공인어학시험 점수기준

구분

TOEIC

TOEFL

TEPS

G-TELP

IELTS

TOEIC SPEAKING

OPIC

PBT

CBT

IBT

점수

700

553

217

82

577

64(level 2)

6.5

140

IM

 

2) 다음 요건 중 하나를 충족하는 자

 영어를 공용어로 사용하는 국가에서 학위를 취득한 자.

 영어를 공용어로 사용하는 국가에서 1년 이상 연수 또는 근무한 자.

 영어로 논문을 발표한 자 [주저자, Full Paper에 한함]

 

 

5. 채용절차

채용공고

(06.18~07.17)

서류심사

(07 3주차)

면접심사

(07 4주차)

E-mail 접수

(bora5456@dgist.ac.kr)

서류심사위원회 개최

개별 심층면접

지원서 접수

1) 접수방법 : E-mail 접수에 한함(bora5456@dgist.ac.kr)

2) 접수기간 : 2018.06.18. ~ 2018.07.17 (18시까지 도착분에 한함)

3) 기타사항

전형단계별 추진 일정에 따라 합격 여부 개별 통보

상기일정은 기관 사정에 따라 변동될 수 있음

적격자가 없을 경우 채용하지 않을 수 있음

 

 

6. 접수 및 제출서류

제출서류

1)온라인 입사지원시

제출서류 목록 (제출기한 : 공고마감일)

필수 제출서류

· 입사지원서자기소개서연구계획서 (혹은 기업 지원 계획서 1

 연구실적(논문특허 등목록과 논문 첫 페이지특허등록증 사본 제출

 

2)서류심사 합격자

제출서류 목록 (제출기한 : 별도 공지)

필수 제출서류

· 최종학력 졸업(예정증명서 및 전 학년 성적증명서 각 1.

 박사 학위 취득자는 학부 및 대학원 졸업(예정)증명서전 학년 성적증명서를 모두 제출

 추천서 2부 제출 (1부는 박사학위 지도교수의 추천서임.)

· 각 근무기관의 경력증명서 또는 재직증명서

· 외국어 능력시험 성적표

· 자격증 사본

추가 제출가능 서류

· 취업보호대상자 증명서

· 장애인 증명서

 입사지원서 상의 내용과 증빙서류가 상이하거나 관련 증빙서류를 미제출하는 경우 불합격 처리

 응시자 증빙서류 사본의 원본은 최종 합격자 발표 후 접수.

 

 

3) 지원서 제출방법 E-Mail 접수(bora5456@dgist.ac.kr)

제출서류를 순서대로 정리하여 하나의 PDF 파일로 첨부

 

7. 기타사항

 국가보훈대상자 및 장애인은 증빙서류 제출시 관계 법령에 따라 우대

「국가유공자 등 예우 및 지원에 관한 법률」제 31조에 의거하여 가점 부여 대상자에게는 면접전형부터 5% 또는 10%의 해당 가산점 부여

「장애인고용촉진 및 직업재활법」에 따라 장애인에 대해서는 면접전형부터 총점의 5% 가산점 부여

 제출된 서류는 일체 반환하지 않으며본 초빙 외 목적으로는 사용하지 않음

 제출된 서류가 허위로 판명되는 경우 합격을 취소할 수 있으며최종합격자에게는 초빙에 관한 추가 서류를 요청할 수 있음

 지원자는 자격요건지원 분야의 적합여부를 확인한 후 제출 (중복지원 불가능)

 기타 채용에 관한 규정은 본원 규정에 의함

 최종 합격자는 신체검사(공무원에 준함실시

 기타 문의사항 (DGIST 핵심단백질자원센터  053-785-1827)

 


#대구경북과학기술원 채용홈페이지

https://www.dgist.ac.kr/site/dgist/menu/133.do?siteId=dgist&snapshotId=2&cmd=read&contentNo=37303

COREMINE medical (Biomedical database) Start.

BioinformaticsAndMe


노르웨이의 PubGene에서 제공하는 사용하기 쉽고 강력한 Biomedical 검색 엔진을 소개하겠다.

COREMINE Medical은 특정 키워드에 연관된 다양한 정보 (Biology, Drug, Food 등등)를 마이닝하여

입력 키워드를 허브로 하는 네트워크와 잘 정리된 카테고리로 정리해 보여준다.

COREMINE medical

https://www.coremine.com/medical/#search



위 링크를 타면 아래 홈페이지가 나타나고, 예제로 있는 Influenza 를 한번 검색해보자.

Influenza 의 키워드가 들어간 여러 정보들이 검색되었고 가장 많은 Connection이 있는 제일 위에 것을 선택했다.

Connection의 개수는 해당 키워드랑 매칭되는 Biomedical 정보의 개수라 봐도 되겠다.




이야.. 화려해보이는 네트워크와 검색된 정보들이 아래 보인다.

오른쪽 화면은 Influenza 에 관련된 Biomedical 정보들을 카테고리 별로 모아둔 것이고,

(Disease, Drug, Gene, Chemical 에서부터 관련 Expert, Food, Anatomy 등 흥미로운 소재들이 많다)

왼쪽은 앞서 말한 카테고리 중 Influenza와 높은 빈도로 매칭되는 Term 들을 시각화하였다.




Biological process를 살펴보니 'viral release from host cell' 가 가장 높은 스코어로 나왔다.

인플루엔자가 바이러스와 관련이 많구나!



COREMINE은 참 간단하게 다룰 수 있어 편하다.

동시에 Breast cancerBRCA2 를 검색하였다 (검색되는 키워드 갯수는 제한이 없어 보이지만,, 많을수록 검색이 잘 안되겠지..)

유방암과 BRCA2 와 관련된 Drug 들을 살펴보았다.



검색에 다소 힘이 부치는 일반연구자들에게 텍스트 마이닝으로 다져진 'COREMINE 플랫폼' 은 상당히 유용해 보인다.

일반적으로 다루는 Gene, Drug, Pathway 외에 관련된 논문, 전문가, wiki까지?! 다룬다.

가입을하여 로그인을 하면 검색했던 정보들을 어느정도까지 저장할 수 있다.

COREMINE medical 은 데이터의 홍수속에서 생물의학연구자가 새로운

Biomedical Insight 를 얻을 수 있는, 디딤돌이 될 Database라 생각된다.



COREMINE medical (Biomedical database) End.

BioinformaticsAndMe

Metastasis (암전이) Start

BioinformaticsAndMe

 

 

 

1. Metastasis (암전이)

원발성 암 (primary tumor site) 부위에서 암세포들이 혈액, 림프를 타고 멀리 떨어진 곳으로 암이 전이가 일어나는 것을 의미한다.

쉽게 말해, 암이 내 몸 다른 곳으로 옮겨졌다는 얘기며, 암에 걸린 사람들 중

90%가 Metastasis (암전이)에 의해 사망한다고 한다..

Metastasis 자체가 아직까지 확실한 메카니즘이 밝혀진 것이 아니기에 쉽게 예측이 안될 뿐더러, 한 번 전이되면

치료하기 매우 어려운 형태로 나타나기, 우리에게 매우 위협적인 생물학 mechanism이 되겠다. 

 

 

 

2. Metastasis 과정

-암세포 전이에는 이를 조절하는 Transcription factor가 중요한 역할을 한다고 알려져있다.

-이 전사인자 활성에 의해 EMT (epithelial-mesenchymal transition) 라는 프로그램이 진행된다.

-EMT : 세포간의 강력한 결합을 가지는 표피세포 (epithelial cell) 가 움직이기 쉬운 중간엽세포 (mesenchymal cell) 로 전환되는 과정.

-결국, 말랑말랑해진 암세포는 혈관과 림프구를 통해 이동하여 다른 조직에 도달하게 되면 EMT의 역과정인 MET (mesenchymal-epithelial transition)가 발생.

-MET : 중간엽세포가 다시 강력한 결합을 가지는 표피세포로 전환되고 고착되는 과정 (전이완성).

 

이해하는 건 아래 그림이 더 쉬어 보인다.

 

3. Metastasis 의 방향성

암전이를 공부하면서 느낀 것은 특정 암에 걸렸을 때, 암에 따른 전이의 경향성? 방향성이 있을까 하는 것이었다.

무슨 암에 걸리면 어느 암에 전이가 쉬운지.. 물론 지금까지 많은 연구들을 통해 임상 의사들의 조언을 받을 수 있지만,

역시나 복잡한 Metastasis의 기작때문에 단언할 수 없을 것이다 (관련 데이터베이스도 거의 없어 보인다..)

그래도 자료를 좀 찾아보니 삼성서울병원에서 1995∼2007년 이 병원에서 치료를 받은 위암, 간암, 폐암, 유방암, 자궁경부암, 대장암, 전립샘암 등 

국내에서 발생빈도가 높은 7대 암 환자 8만7122명을 분석해 암이 어떤 장기와 조직으로 전이되는지를 보여 주는

‘암 전이지도’ 를 만들었더라.

 

예를 들어,  간암에 걸렸다면 폐로 전이되는 확률이 가장 높았다. 라고 해석하면 되겠다.

 

4. Metastasis Suppressor Genes

고무적인 사실을 그동안의 연구를 통해 암전이를 늦추거나 억제하는 유전자들을 일부 찾아냈다는 사실이다.

공부를 더 해봐야겠지만, 암 자체를 억제하는 유전자들과 암 전이를 억제하는 유전자들의 공통점이 별로 없다고 한다.

비슷해보이지만 다른 기작을 가질 것이라 예상되며, 몇몇 Metastasis Suppressor Genes 들이 알려져 있다.

NM23, MKK4, KAI1, BRMS1, KISS1, RHoGD12, CRSP3, VDUP1, KLF17, GAS1, SNED1, FLNC

 

#Metastasis 기작 관련 논문 내용도 찾아보았다

ㄱ) As the invasive site are distinct from the site of primary tumor origin, the cellular micro-environments are also changed: e.g., O2 concentration, pH value, cytokines, growth factors, chemokines, etc.

Hurst D. R. & Welch D. R. Metastasis suppressor genes at the interface between the environment and tumor cell growth. Int Rev Cell Mol Biol. 286, 107–180 (2011)
 
 

 

ㄴ) Starting from the outside of cell, extracellular matrix, a few MS genes are active on tissue invasion and matrix remodeling by controlling the matrix metalloproteases.

Yan J., Yang Q. & Huang Q. Metastasis suppressor genes. Histol Histopathol 28, 285–292 (2013)
 

ㄷ) Numerous micro-RNA are identified as MS genes in cancers, which make the cellular signaling map more complex.

Pencheva N. & Tavazoie S. F. Control of metastatic progression by microRNA regulatory networks. Nat Cell Biol. 15, 546–554 (2013).
 

 

 

마무리하며...

사실 Metastasis 생물학적 기작에 대해 집중 다룰려고 했지만,, 쉽지 않은 주제다 보니, 부가 설명이 길어졌다.

사실 모든 생물학 주제들이 이런듯하다... 파면 팔수록 어렵고 난해하다. 아무튼..

다음 칼럼에서 Metastasis 의 다양한 가설들을 살펴보고 Public db가 있는지 확인해보자.

 

 

 

Metastasis (암전이) End

BioinformaticsAndMe

[Expert] Bio ICT 개발자

1. 주요 수행 업무 및 역할

  • Bio와 IT가 융합된 신사업을 추진하기 위애 Bioinformatics와 CS에 대한 지식과 경험을 두루 갖춘 융합형 인재를 채용하고자 하며 다음과 같은 업무를 수행하게 될 것입니다.
    • NGS Pipeline 및 관련 제반 시스템 구축
    • 유전체 분석 워크로드 생성 및  유효성 검증
    • 유전체 분석 프로세스 최적화
    • 클라우드 서비스 플랫폼 구축

 

2. 필요 역량

  • Sequence 분석 지식과 경험
  • BWA, Bowtie, GATK 및 관련 오픈소스 내부 구조 및 관련 알고리즘에 대한 이해
  • S/W Programming 기술(Java, Python, NodeJS, AngularJS, C/C++)
  • 유전체 분석과 관련된 서비스 플랫폼 구축 경험 우대
  • 오픈소스 커뮤니티 활동 경력 우대

 

3. 자격 요건

  • Bioinformatics 혹은 컴퓨터 공학 전공 석사 이상
  • Bioinformatics 관련 업무 3년 이상
  • 클라우드 서비스 플랫폼 구축 경험 유



주 근무지

 본사_SK T-타워

직무

 SW Engineering

조직

 Data_Unit
채용 유형 정규직
직급 유형 실무직(Expert)

접수기간

 2018. 7. 11- 2018. 8. 10 

#SK텔레콤 채용홈페이지

https://tas-sktelecom.taleo.net/careersection/ex/moresearch.ftl?lang=ko&portal

+ Recent posts