Ligand 라이브러리 for CADD Start.

BioinformaticsAndMe





CADD에서 사용될 리간드 Library의 특징을 살펴보자



리간드 라이브러리는 관심 있는 타겟의 1)약물 유사성을 높이거나 2)생리화학적 특징을 사용하여 제작된다.

매우 빠른 Docking algorithm을 사용할지라도 수백만 compound의 docking은 상당한 시간이 걸린다.

이 시간을 줄이기 위해서는 불안정하거나 선호되지 않는 compound를 제거해야한다.





1) 약물 유사성을 높이기 위해, 일반적으로 'Lipinski’s rule'을 잘 따라야한다.

그 이유는 리핀스키 규칙을 벗어나게 되면, 약물의 흡착력이 떨어지는 것으로 확인되었기 때문이다.


'Lipinski’s rule'

구강 복용 약물은 다음 기준에서 한가지도 위반할 수 없다

a) maximum of five hydrogen bond donors (수소결합 donor가 최대 5개(N-H, O-H))

b) no more than 10 oxygen and nitrogen atoms (수소결합 acceptor가 10개 미만(N, O))

c) molecular mass less than 500 daltons (분자량이 500달턴보다 적음)

d) an octanol-water partition coefficient of not greater than five (옥탄올-물 사이에서 해당 분자의 분배계수 값이 5 이하 안됨)


리핀스키의 규칙을 따르는 대표약들은 아스피린과 암로디핀이다.





2) 생리화학적 특징은 주로 'DMPK/ADMET' 을 이용한다.

ADMET: in vitro, 약물동태독성 - 흡수, 분포, 대사, 배설(absorption, distribution, metabolism and elimination)

DMPK: in vivo, 약물대사 약물동력학 - (drug metabolism pharmacokinetic)


DMPK/ADMET 특성을 예측하는 Ligand 기반 방법은 통계 및 학습 접근법, 분자 설명자 및 실험 데이터를 사용하여,

장내 흡수/투과성, 반감기, 혈장분포 등의 생물학적 프로세스를 모델링한다.








#참고문헌

1) Lipinski CA, Lombardo F, Dominy BW, & Feeney PJ (2001) Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Advanced drug delivery reviews 46(1-3):3-26.

2) Kelder J, Grootenhuis PDJ, Bayada DM, Delbressine LPC, & Ploemen JP (1999) Polar molecular surface as a dominating determinant for oral 





Ligand 라이브러리 for CADD End.

BioinformaticsAndMe

'Drug Discovery' 카테고리의 다른 글

AI 기반 신약후보물질 발굴 기업  (0) 2019.12.11
CADD(Computer-Aided Drug Design)_v2  (0) 2019.05.21
Ligand 데이터베이스  (0) 2018.09.03
Cloud Drug discovery  (0) 2018.08.15
Drug repositioning (신약재창출)  (0) 2018.07.23

비지도 학습(Unsupervised learning) Start.

BioinformaticsAndMe





1) Unsupervised learning (비지도학습, 자율학습)

- 레이블 되지 않은 데이터에 대해 컴퓨터 스스로 학습하는 기계 학습(Machine Learning)의 한 방법.
- No labeled 데이터로 특정한 패턴과 규칙의 알고리즘 모델을 만든다. 즉 y없이 x만 이용해서 학습하는 것.






2) Unsupervised learning 예시

- 아래 그림은 샘플(column)과 유전자(row)의 발현을 기반으로 그린 Heatmap이다.

- Heatmap에서는 주로 Hierarchical clustering을 사용하는데, 이 방법이 비지도학습의 예이다.

- 사용자는 유전자나 샘플에 대해 어떠한 정보도 주지 않고, 오직 발현값만을 기준으로 계층적 클러스터링을 진행한다.

- Unsupervised clustering을 통해, co-expression을 보이는 유전자 군집을 뽑아낼 수 있고, outlier 샘플을 확인할 수도 있다.






3) Unsupervised learning을 이용한 알고리즘

  • k-평균 클러스터링 (k-means clustering)
  • 계층적 클러스터링 (Hierarchical clustering)
  • 분포 추정 (Underlying Probability Density Estimation)
  • 주성분 분석 (Principal component analysis, PCA)
  • 특이값 분해 (Singular value decomposition, SVD)




4) Unsupervised learning에서 참고사항

- Label 정보가 없다면, Unsupervised learning(비지도 학습) 알고리즘을 사용한다.

- 또한, 보유한 데이터를 최적으로 설명하는 Label을 찾고 싶다면, Supervised보단 Unsupervised가 효과적이다.

- 'ENCODE와 Roadmap Epigenomics Project'에서는 Histone modification이나 Transcription factor binding의 패턴을 찾기위해 Unsupervised learning을 사용한다.





#참고 문헌

1) Libbrecht, M. W., & Noble, W. S. (2015). Machine learning applications in genetics and genomics. Nature Reviews Genetics, 16(6), 321.

2) https://ko.wikipedia.org/wiki/%EC%A7%80%EB%8F%84_%ED%95%99%EC%8A%B5






비지도 학습(Unsupervised learning) End.

BioinformaticsAndMe


Rare disease (희귀질환) Start.

BioinformaticsAndMe







1. Rare disease (희귀질환) 정의

- 전체 인구 중 매우 적은 비중에서 나타나는 희귀 질병으로 대부분 치명적이다.

- Rare disease가 멘델의 법칙을 따르기에 Mendelian disease라고도 불린다.

- 미국은 전체 인구 중 20만명 정도가 희귀질환을 겪고있는 것으로 알려졌다.

- 전세계적으로 5~7000개 정도의 희귀질환이 알려져 있다.

- 희귀질환 예: 고셔병, 신경섬유종증, 터너증후군, 혈우병 등





2. 희귀질환 기준

- 희귀질환을 정의하는 기준은 국가, 기관, 질환에 따라 매우 상이하다.

- 미국은 1500명 중 1명이, 일본은 2500명 중 1명이 걸리는 질환을 희귀질환이라 명한다.

- 유전체 분석에서 희귀질환의 변이는 보통 1% allele frequency를 기준으로 판별한다.

- 일반적으로 1%라는 것이지 질환의 종류에 따라 ~0.5%, ~0.01% 까지 낮아질 수 있다.







3. 관련 가설

Common disease/Common variant: 일반적으로 흔한 질병은 흔한 변이들로 인해 생긴다 (위 그림 참고). 

Rare disease/Rare variant: 희귀한 질환은 희귀 변이로 생긴다 (위 그림 참고).

- 변이의 Allele frequency와 Functionality(Effect size)는 반비례 관계이다.

▶ Rare disease: 높은 penetrance, rare allele.

▶ Common disease: 낮은 penetrance, common allele.

- Missing heritability: 단일 유전 변이가 질병, 행동 이외의 또 다른 표현형들의 유전력을 모두 설명할 수는 없다는 문제점.



- Out of Africa: 인류의 첫 번째 조상은 아프리카에서 기원했다는 이론.

▶ 진화적으로 Genetic diversity가 크게 증가 → Rare variant를 찾기 어려워짐.





4. 희귀변이 분석에 사용되는 데이터베이스

- Exome Aggregation Consortium(ExAC) (http://exac.broadinstitute.org/)

▶6만명 이상의 정상인 Exome Data를 모아, 유전자의 기능에 영향을 미칠만한 변이들의 목록을 조사한 데이터베이스.


- Gene Matcher (https://genematcher.org/)

▶ 연구 중인 유전자를 올리면 세계에서 매칭되는 사람들이 서로 공유하도록 연결 (데이터 쉐어링).

▶ 샘플사이즈가 중요한 희귀 질환 연구에 n값을 늘려줌.

▶ 타 DB와도 연계(PhenomeCentral, DECIPHER 등).


- gnomAD (http://gnomad.broadinstitute.org/)

▶ 브로드 연구소의 genome Aggregation Database.

▶ 123,136명의 Whole exome과 15,496명의 Whole genome 정상인 데이터.

▶ 각 유전체 상의 위치(loci)별 대립인자 빈도(allele frequency) 정보를 모두 제공.

▶ 수십만 명당 한 명에서만 발견되는 매우 희귀한 유전성 질환 변이를 확인.

▶ 이후 다른 환자에서 발견되는 변이에 참고할 수 있는 유용한 DB로 활용 가능.

▶ 단, gnomAD에는 소수의 환자 데이터도 포함됐으므로, 결과 해석에 주의.



- GenomeAsia 100K (http://www.genomeasia100k.com/)

▶ 아시안 10만 게놈 프로젝트, 20여개 아시아 국가 국민의 게놈이 해독을 목표.

▶ 한국(마크로젠), 싱가폴(난양과학기술대학), 인도(MedGenome) 주도.

▶ 아시안 인종적 특성이 반영된 게놈 정보를 바탕으로 정밀 의학에 활용 가능.


- KOVA (http://kobic.re.kr/kova/)

▶ Korean Variant Archive: 1,055명의 건강한 한국인 Coding variant 데이터베이스.

▶ 한국인 고유의 SNP reference 구축 목표.


- KRGDB (http://152.99.75.168/KRGDB/menuPages/intro.jsp)

▶ Korean Reference Genome: 1,722명 한국인 유전체에 존재하는 유전변이 정보들을 수집하고, 데이터베이스화.

▶ 생산된 유전변이들은 일반인들이 보편적으로 가질 수 있는 유전변이로써 희귀







#참고 문헌

1) Hindorff, L. A., Gillanders, E. M., & Manolio, T. A. (2011). Genetic architecture of cancer and other complex diseases: lessons learned and future directions. Carcinogenesis, 32(7), 945-954.

2) https://genome.sph.umich.edu/wiki/Rare_variant_tests





Rare disease (희귀질환) End.

BioinformaticsAndMe

'Medicine' 카테고리의 다른 글

겸상적혈구빈혈증 (Sickle cell anemia)  (0) 2019.11.26
[Medical terminology] 의학용어2  (0) 2019.11.01
[Medical terminology] 의학용어1  (0) 2019.10.31
적아세포증 (Erythroblastosis fetalis)  (0) 2019.09.02
Metastasis (암전이)  (1) 2018.07.11

Ligand 데이터베이스 Start.

BioinformaticsAndMe





가상 스크리닝에서 리간드 db의 필요성을 이해하고, 관련 database를 살펴보자.




Virtual HTS(High Throughput Screening)에서는 방대한 Chemical Ligand db를 스크리닝하고, 합성을 위한 compound 우선 순위를 정한다.

이 과정에서 우리는 Virtual Library가 필요하다.

NGS에서 시퀀싱을 위해 라이브러리가 필요하듯이, 가상 스크리닝에서도 다양한 사이즈와 디자인을 갖는 Virtual library로 스크리닝을 진행한다.

Virtual Library는 일반적으로 아래 3개로 나뉜다.



1)일반라이브러리 (any target)

2)특정한 타겟군이 있는 라이브러리 (family of related targets)

3)하나의 타겟만 보는 라이브러리 (single target)



일반 라이브러리는 다양한 computational & combinatorial tool로 제작될 수 있다.

연구 초기에는 한정된 분자식으로, 만들어낼 수 있는 라이브러리 개수가 적었다고 한다.

그러나, 기술과 연구가 발달함에 따라 분자식을 넘어 그 사이를 채우는 화학 공간 정보를 이용해 라이브라리 다양성을 증대시켰다.

기존에 없던 정보들이 계속 더해져가고 우리는 그만큼 수많은 Virtual library를 구현할 수 있게된 것이다.



#아래는 chemical compound 데이터베이스들이다. 'PubChem과 Zinc'가 상당량의 compound 정보를 보유하고 있다.

DataBase

Type

Size

PubChem

Biological activities of small molecules

~68,000,000

Accelrys Available Chemicals Directory (ACD)

Consolidated catalog from major chemical suppliers

~7,000,000

PDBeChem

Ligands and small molecules referred in PDB

19,838

Zinc

Annotated commercially available compounds

~90,000,000

DrugBank

Detailed drug data with comprehensive drug target information

7469

ChemDB

Annotated commercially available molecules

~5,000,000

WOMBAT Database (World Of Molecular BioAcTivity)

Bioactivity data for compounds reported in medicinal chemistry journals

331,872

MDDR (MDL Drug Data Report)

Drugs under development or released; descriptions of therapeutic

180,000

3D MIND

Molecules with target interaction and tumor cell line screen data

100,000


참고로 대부분의 Virtual HTS는 이미 알려진 물질을 시작으로 복잡성을 더하여 합성해나가는 방식을 취한다.

위의 데이터베이스들이 그 스타트선에 있는 Chemical compound, drug, enzyme, reactant DB 라 볼 수 있겟다.




#참고문헌

1) Agarwal AK & Fishwick CW (2010) Structure-based design of anti-infectives. Ann N Y Acad Sci 1213:20-45.

2) Song CM, Lim SJ, & Tong JC (2009) Recent advances in computer-aided drug design. Brief Bioinform 10(5):579-591.

3) Ortholand JY & Ganesan A (2004) Natural products and combinatorial chemistry: back to the future. Curr Opin Chem Biol 8(3):271-280.





Ligand 데이터베이스 End.

BioinformaticsAndMe

'Drug Discovery' 카테고리의 다른 글

CADD(Computer-Aided Drug Design)_v2  (0) 2019.05.21
Ligand 라이브러리 for CADD  (0) 2018.09.05
Cloud Drug discovery  (0) 2018.08.15
Drug repositioning (신약재창출)  (0) 2018.07.23
CADD (Computer-Aided Drug Design)  (0) 2018.07.15

Docker 설치 Start.

BioinformaticsAndMe




Docker Installation을 진행해보자.



Docker의 최대 장점 중 하나는 어느 OS에서도 쉽게 설치가 가능하다는 점이다.

리눅스 모든 계열뿐만아니라 맥, 윈도우에서도 설치가 가능하다.

이 포스팅에서는 'Ubuntu 16.04' 를 기준으로 설치과정을 살펴보겠다.





1. Uninstall old versions

아래 명령어로 혹시 나도 모르게 설치해놨을지 모를 구버전 docker를 먼저 제거해준다.

구버전을 제거해주지 않고 진행하면, OS 내에 충돌이 일어나 설치가 안된다.

'/var/lib/docker' 는 Docker에 관련된 이미지, 컨테이너 정보 등등이 저장되는 곳이다.


$ sudo apt-get remove docker docker-engine docker.io

$ sudo apt-get purge docker-ce

$ sudo rm -rf /var/lib/docker




2. Install Docker CE

CE는 Community Edition이란 의미이다. EE(Enterprise Edition) 버전도 있지만, 대부분 일반 개발자들은 CE를 사용할 듯 싶다.

Docker 친절하게도 3가지 방법 중 하나를 선택해 설치를 진행할 수 있다.


1) Install using the repository : 호스트 저장소에 Docker를 등록해 설치

2) Install from a package : Docker 패키지를 다운받아 설치

3) Install using the convenience script : 설치스크립트를 다운받아 실행 설치


3가지 방법 모두 어렵지 않으므로 기호에 맞게 진행하면 되겠다.

필자는 개인적으로 3번째 방법이 제일 편했다.


'get-docker.sh' 란 이름의 sh 파일을 다운받아 실행해주면 설치 끝이다..


$ curl -fsSL https://get.docker.com -o get-docker.sh

$ sudo sh get-docker.sh



get-docker.sh

https://get.docker.com/




마무리하며..

사실 Docker 설치는 구글링하면, 여러 전문가분들이 쉽게 설명해주셨다.

참고로 Docker는 버전을 계속 업데이트 중이다. 공식 홈페이지에 있는 최신 버전은 '18.03.0 ce' 다.

간혹 다른 사람들이 올려놓은 Docker 관련 스크립트가 나한테만 안먹힐 때가있다.
ㅜㅜ굉장한 삽질끝에 알아낸 것은..
Docker 버전에 따라 command가 조금씩 달라지거나, 새롭게 추가 혹 제거된 것들이 있다.

똑같이 했는데 계속 오류가 났다면 Docker 버전을 점검해보는 것이 좋겠다...ㅠ





#Docker 공식홈페이지에서 자세한 설치과정을 볼 수 있다.

https://docs.docker.com/install/linux/docker-ce/ubuntu/





Docker 설치 End.

BioinformaticsAndMe

'Program' 카테고리의 다른 글

Jupyter notebook (주피터 노트북)  (0) 2019.11.14
[Kubernetes] 쿠버네티스 소개  (0) 2019.10.18
API 기초 학습  (0) 2019.09.26
Docker 시작하기  (1) 2018.07.17
[Pachyderm] Splitting Data for Distributed Processing (분산처리)  (0) 2018.07.08

2018년 하반기 산학장학생 모집(석/박사) 관심채용 등록하기

모집기간
 
2018.08.28 10:00 ~ 2018.09.13 14:00
모집분야
조직모집분야상세 내용전공근무지
중앙연구소R&D- Platform Tech : 무기소재 합성/가공,
코팅, 분산, 점/접착, 유기/고분자 
합성 및 물성, 박막증착, CFD, 
고분자유변학, 공정설계, Optimization,
촉매, 분석, Printing & Patterning, 
Deep Learning, Big Data 
- 친환경/Energy 소재 : 연료전지, 
차세대 2차전지 
- 고기능신소재 : 차세대 무기/ 
고분자/전도성 소재, 친환경 소재 
(물, 공기 질 개선용 소재) 
- 바이오 : 조직배양, 형질전환, 
식물/작물 생리, 
유전자편집 / 분석(NGS), 
실험통계 / Machine Learning, 
Protein Engineering, 분자육종
화학/화학공학 
고분자공학 
금속/재료공학 
기계공학 
전기전자공학 
생명공학 
생명정보학 
식물생리학 
작물생리학 
유전체학 
생화학
경기도 과천시
대전광역시
서울특별시 강서구
기초소재사업본부R&D◈ 기초소재연구소 
- 고부가가치 제품 개발 : 메탈로센 촉매, 고흡수성 수지, 합성고무, ABS 등 
- 고기능성 소재 개발 : 유/무기소재 합성/중합/가공 등 
- 공정 Modeling, Simulation & Optimization 

◈ TECH센터 
- 고분자 (압출/사출) 공정 설계 및 최적화, 첨단 성형 기술 개발 
- 복합소재 성형 공정 및 물성, 복합소재 활용 부품 설계 
- 기초소재 제품 신시장 개척, 소재 및 가공기술 개발
화학/화학공학 
고분자공학 
금속/재료공학 
기계공학
경기도 과천시
경기도 오산시
대전광역시
전라남도 나주시
전라남도 여수시
전라북도 익산시
전지사업본부R&D◈ Battery연구소 
- 소재/부품 개발 : 유/무기 소재 합성 및 분석 기술, 금속/고분자 재료 물성 연구 
- 전지 선행 개발 : 고에너지밀도 전지 기술, 고출력 전지 기술, 차세대전지 설계 및 공정 기술 
- 공정 선행 연구 : 유변학, 혼합/분산, 건조, 공정 제어, 검사 자동화, 
정밀 압연, 금형 설계, 데이터 처리 
- Pack 개발 : 기계설계, CAE 
- BMS : BMS HW, SW, 부품, Safety, WPAN, AI Big data, Cloud Computing

◈ 소형전지개발센터 
- 선행기술 개발 : 고에너지밀도, 급속충전, 장수명 등의 신기술 개발 
- Cell 개발 : IT(휴대폰, 노트북), 
자동차, Drone 등에 적용되는 이차전지 셀 설계 
- Pack 개발 
1) 기구 : 사출/프레스설계, 구조 설계 및 용접 연구개발 및 검증
2) 회로 : H/W 및 S/W(알고리즘) 회로 설계 및 검증 

◈ 자동차전지개발센터 
- Cell 개발 : 전기 자동차용 리튬 이차전지 설계 및 양산 개발 
- Pack/Module 개발 : 자동차전지용 Pack 기구 및 부품 설계(CAD 활용)  
- 전장부품 개발 : 자동차전지의 전장 부품 개발 
- BMS : 회로, 전장부품, Embedded SW, BMS System 개발 
- EMC 설계 : 자동차전지 EMC 디자인 최적화 설계 

◈ ESS전지개발센터 
- Cell 개발(중대형 파우치) : 리튬 이차전지 설계 및 관련 소재, 소재 합성 및 전기화학 특성 분석 기술 
- Pack 개발 : 기구설계(사출/프레스), 구조/냉각 설계, 양산 설비 개발, 전력망 계통해석 
- 전장부품 개발 : ESS전지의 전장 부품 개발 
- BMS 회로/SW 개발 : HW/SW/FW 
개발, 제어/신호처리, SOC 개발
화학/화학공학 
고분자공학 
금속/재료공학 
기계공학 
전기전자공학 
컴퓨터공학
경기도 과천시
대전광역시
정보전자소재사업본부R&D◈ 정보전자소재연구소 
- 유기 합성, 고분자 합성, 고분자 가공, 고분자 물성, 점·접착 소재, 유/무기 복합 소재, 광학 설계, 액정 소재, 전지 재료, 유변학, 유체역학 

◈ 사업부 제품개발 
- 광학소재 (편광판), 고기능소재 (디스플레이소재, 반도체소재, 자동차소재) 제품 개발
화학/화학공학 
고분자공학 
재료공학 
기계공학
대전광역시
충청북도 청주시(오창)
충청북도 청주
재료사업부문R&D◈ 재료연구소 / 사업부 제품개발 
- Display 소재 : Color / 투명 PR용 
감광성 재료 및 분산 기술, OLED물질 
합성 및 소자 평가, 형광물질 개발, 
Polyimide 재료 및 Silicone 재료 개발 
- 전지 소재 : 전구체 / 양극재 합성 및 전지 재료 평가 
- 신규 분야 : 자동차 구조용 접착재료, 반도체 / 회로 소재, Bulk 세라믹 등 
무기재료
화학/화학공학 
무기화학 
고분자공학 
신소재공학 
재료공학 
기계공학 
전기전자공학
대전광역시
서울특별시 강서구
전라북도 익산시
충청북도 청주
생명과학사업본부R&D◈ 생명과학연구소 
- 연구 : 당뇨 및 연계질환, 항암면역 분야의 신약 개발을 위한 신규 타겟 발굴, 유기합성, 생물학적 연구, 약효 및 독성 평가, DMPK, 기반기술 연구 
- 분석 : 합성/바이오 신약 및 의약품에 대한 분석 수행 
- CMC : 합성공정 및 제형 개발, 바이오 배양 및 정제 등 공정 개발 
- 임상 : 임상설계 및 관리, 의약품 허가/등록, 학술마케팅 등
생물학 
미생물학 
면역학 
유전공학 
화학/화학공학 
고분자공학 
약학/수의학 
간호학 
통계(임상)
서울특별시 강서구
충청북도 청주시 흥덕구(오송)
지원 자격 및 절차
지원자격

1) 2019년 8월 이후 석사/박사 학위 취득 예정자 
(기 졸업자 및 2019년 2월 학위 취득 예정자의 경우, 신입사원 채용 (석/박사) 공고로 지원하여 주시기 바랍니다.) 
2) 해외여행에 결격사유가 없는 자 
3) 남성의 경우 입사일 기준 군필, 면제자 또는 전문연구요원 T/O소지(보충역) 및 전직 가능자

전형절차
  1. 서류전형
  2.  
  3. 인적성검사
  4.  
  5. 1차면접
  6.  
  7. 건강검진
  8.  
  9. 2차면접
제출방법

1) 서류접수 : LG그룹 채용사이트 (http://careers.lg.com) 內 LG화학 모집공고에서 On-line 지원 
2) 제출서류 : 채용사이트 內 입사지원서, 전공요약 발표자료(PDF본) 
※ 연구분야 입력시 공고에 첨부된 전공요약 발표자료를 표지 포함 5장 이내로 작성하여 PDF로 업로드 
- On-line 지원서 내 최종 학력 입력 시 논문/주요연구과제 항목에 업로드 
- 지원서 접수 완료 이후, 전공요약 발표자료 수정 불가 
- 본 파일은 1차 면접(전공) 시 발표자료로 사용되므로 참고하셔서 작성해 주시기 바랍니다.  
※ 졸업(예정)증명서, 성적증명서, 공인어학성적표, 자격증 등은 면접 합격자에 한하여 제출 (추후 안내) 
3) 접수기간 : 2018. 8. 28(화) ~ 2018. 9. 13(목) ☞ 최종 마감일은 오후 2시까지 지원 가능

기타사항

1) On-line 접수만 가능합니다. (우편접수, e-mail 접수 및 방문접수는 받지 않습니다.) 
2) 허위기재 사실이 발견될 시에는 즉시 불합격 혹은 입사를 취소합니다. 
3) 국가보훈대상자 및 장애인은 관련법규에 의거 우대합니다. 
4) 각 전형결과 및 통보는 e-mail을 통해 진행되오니, e-mail주소를 정확하게 기재하여 주시기 바랍니다. 
5) 기타 문의사항 발생 시 
① LG Careers Site 內 상단 “채용문의”에서 1:1 질문하기를 통해 문의 
② LG화학 기술연구원 대전.인사지원팀 (042-870-6474)으로 문의 (상담 가능 시간 : 평일 09-17시) 

※ 공고 마감일은 지원 관련 문의가 많아 답변 및 대응이 늦어질 수 있습니다. 
등록 마감 이후, 추가 등록 및 수정이 불가하므로 관련 문의는 마감 3일 전까지 요청하여 주시기 바랍니다.



#LG화학 채용홈페이지

http://apply.lg.com/app/job/RetrieveJobNoticesDetail.rpi

2018년 하반기 R&D 산학장학생 모집(석/박사) 관심채용 등록하기

모집기간
 
2018.09.03 06:00 ~ 2018.09.18 17:00
모집분야
조직모집분야상세 내용전공근무지인원
작물보호연구센터작물보호제 연구개발신물질 생물활성 스크리닝 
작물보호제 신제품 연구개발 
제형 연구개발 
잔류성 분석(작물/토양/수중)
농학 
(농)화학 
(농)생물학 
곤충학 등
충청남도 논산시0명
안전성연구(독성/분석)인축 독성 및 
환경독성 연구
화학, 약학 
수의학, 독성학 등
충청남도 논산시0명
생물농약 연구생물농약 개발 
생물공정 연구
농학 
(농)생물학 
미생물학 등
충청남도 논산시0명
육종연구센터육종 연구전통/분자 육종 
DNA 마커/병리/조직배양 연구
원예학 
분자생물학 
생명과학 
생물정보학 등
경기도 안성시0명
유전형질 연구작물 유전체 분석 
형질(Traits) 개발
식물학 
유전공학 
생명과학 
생물정보학 등
충청남도 논산시0명
지원 자격 및 절차
지원자격

- 2019년 8월 이후 석사, 박사 학위 취득 예정자(석사 2년차, 박사 3년차 이상, 석박통합 5년차 이상에 한함) 
(기 졸업자 및 2019년 2월 학위 취득 예정자의 경우 신입사원 채용 공고로 지원하여 주시기 바랍니다.) 
- 졸업 후 팜한농 입사를 희망하는 자 
- 해외여행에 결격사유가 없는 자 
- 남성의 경우 입사일 기준 군필 혹은 면제자

전형절차
  1. 서류전형
  2.  
  3. 1차면접
  4.  
  5. 건강검진
  6.  
  7. 2차면접
제출방법

1) 서류접수 : LG그룹 채용사이트 (http://careers.lg.com) 內 팜한농 모집공고에서 On-line 지원 
2) 제출서류 : 채용사이트 內 입사지원서, 전공요약 발표자료(PDF본) 
※ 연구분야 입력 시 공고에 첨부된 전공요약 발표자료를 표지 포함 5장 이내로 작성하여 PDF 파일로 업로드 
- On-line 지원서 내 최종 학력 입력 시 논문/주요연구과제 항목에 업로드 
- 지원서 접수 완료 이후, 전공요약 발표자료 수정 불가 
- 본 파일은 1차 면접 시 발표자료로 사용되므로 참고하셔서 작성해 주시기 바랍니다. 
※ 재학증명서, 성적증명서, 공인어학성적표, 자격증 등은 면접 통과자에 한하여 제출 (추후 안내) 
3) 접수기간 : 2018.9.3(월) ~ 2018.9.18(화) ☞ 최종 마감일은 오후 5시까지 지원 가능

기타사항

1) On-line 접수만 가능합니다. (우편, e-mail 및 방문 접수는 받지 않습니다.) 
2) 허위기재 사실이 발견될 시에는 즉시 불합격 혹은 입사를 취소합니다. 
3) 국가보훈대상자 및 장애인은 관련 법규에 의거 우대합니다. 
4) 각 전형결과 및 통보는 e-mail로 진행되오니, e-mail주소를 정확하게 기재하여 주시기 바랍니다. 
5) 기타 문의사항 발생 시 
① LG Careers Site 內 상단 “채용문의”에서 1:1 질문하기를 통해 문의 
② E-mail 및 비밀번호 분실 시 “로그인”에서 이메일 주소 및 비밀번호 찾기를 통해 확인 
③ 팜한농 인사팀(02-3159-5574)으로 문의 
※ 공고 마감일은 답변 및 대응이 늦어질 수 있습니다. 등록 마감 이후, 추가 등록 및 수정이 불가하므로 관련 문의는 마감 3일 전까지 요청하여 주시기 바랍니다.



#팜한농 채용홈페이지

http://apply.lg.com/app/job/RetrieveJobNoticesDetail.rpi

의료영상 AI 기업 현황 Start.

BioinformaticsAndMe






- 2017년 12월, 미국 시카고에서 세계 최대 규모의 방사선(X-Ray, CT, MRI) 의료기기 전시회인 RSNA(Radiological Society of North America)가 개최.

인공지능의 활용도가 가장 높을 것으로 기대되는 영역 중 하나가 방사선관련 의료 영상 분석.

- 2017년 RSNA에는 머신러닝 기업들이 대거 참여 (전체 731개 참여 업체 중 머신러닝 관련 기업은 총 48개).


사업분류 기업명 국가 비즈니스 모델 제품명
AI 솔루션 Lunit 대한민국 폐암 영상진단 Lunit Insight
Vuno 대한민국 골연령 진단 VUNO-Med
iCAD 미국 유방암 영상진단 PowerLook
Subtle Medical 미국 저선량 의료영상 분석 Subtle-Gad, PET, MRI
ADIDENCE 네덜란드 폐암 진단 Lung CAD
Adidoc Medical 이스라엘 의료영상 분석  
Arterys 미국 의료영상 분석  
Blackford Analysis 영국 의료영상 분석  
Combinostics 핀란드 의료영상 분석  
Contextflow 호주 의료영상 검색  
CuraCloud 미국 의료영상 분석  
CureMetrix 미국 유방암 영상진단  
DeepRadiology 미국 의료영상 분석  
DesAcc 영국 의료영상 분석  
DIA Imaging Analysis 이스라엘 의료영상 분석  
HealthLevel 미국 병원관리 솔루션 Foundations
Khiron Medical Technologies 영국 유방암 영상진단  
Koios Medical 미국 유방암 영상진단  
Lpixel 일본 의료영상 분석  
Quantib 네덜란드 의료영상 분석  
Quantitative Insights 미국 유방암 영상진단 QuantX
Qure 인도 의료영상 분석  
RadLogics 미국 의료영상 분석 AlphaPoint
Riverain Technologies 미국 폐암 영상진단  
ScreenPoint Medical 네덜란드 유방암 영상진단 Transpara
TaiHao Medical 대만 의료영상 분석 BR-ABVS Viewer, BR-USCAD
AI Analysis 미국 의료영상 분석  
AI Visualize 미국 의료영상 분석  
Galileo CDS 미국 의료영상 분석  
HeartVista 미국 MRI 영상 분석  
Mindshare Medical 미국 의료행위 의사결정 지원  
Radiology Universe Institute 미국 의료영상 분석  
Realize 미국 의료영상 분석  
Visage Imaging 미국 의료영상 분석  
Zebra Medical Vision 이스라엘 의료영상 분석 AI1
AI 플랫폼 Envoyai 미국 의료영상 플랫폼 EnvoyAI
Nuance Communications 미국 의료영상 공유 PowerScribe 360, Powershare
Google Cloud 미국 의료영상 플랫폼  
Pure Storage 미국 의료정보 저장  
OnePAcs 미국 PACS  
AI 하드웨어 NVDIA 미국 GPU 제조  
의료기기 Philips 미국 종합 의료기기 제조  
Samsung 대한민국 영상진단기기 제조  
Siemens Healthineeers 미국 종합 의료기기 제조  
Toshiba Medical (Canon Group) 일본 영상진단기기 제조  
학회 American College of Radiology 미국 방사선 학회  
Society of AI in Medicine & Healthcare 미국 AI 학회  
비영리단체 RAD-AID 미국    

자료: RSNA, 미래에셋대우 리서치센터



의료 AI는 연구개발 단계에서 본격적으로 임상적용단계에 진입하며 실체화되고 있음.

- 현재까지 세계적으로 임상용도로 상용화된 인공지능 영상분석 솔루션은 아직 없는 상황. 대부분 기술개발 혹 규제기관 인허가 과정을 진행 중.

- 그러나 현재 추세를 고려할 때 2018년에는 의료기기 인증을받는 업체가 나올 가능성도 매우 높아진 상황.





특히, 국내의 대표적인 의료 인공지능 솔루션 개발업체인 루닛은 2017년 RSNA에서 자사의 인공지능 솔루션(Lunit Insight)을 공개.

Lunit Insight: X-Ray 영상을 바탕으로 병변 의심 부위를 색깔로 표시해주는 솔루션.

루닛은 세계적인 AI 기술을 보유한 기업으로 세계 100대 AI 기업으로도 꼽히고 있음.






- 또한 루닛은 2017년 RSNA에서 EnvoyAI과 Nuance사와의 파트너쉽을 발표.

#Nuance: 세계 최대의 의료영상 공유 플랫폼.

#EnvoyAI: 의료영상 플랫폼 스타트업임.

- 루닛의 솔루션은 Nuance와 EnvoyAI의 시스템에 통합되어 제공될 예정.





# 미래에셋대우의 '의료AI에 대해서 시장에서 가장 궁금해하는 5가지 질문'을 인용하였습니다.

http://www.pharmstock.co.kr/news/articleView.html?idxno=11196





의료영상 AI 기업 현황 End.

BioinformaticsAndMe

지도 학습(Supervised learning) Start.

BioinformaticsAndMe





1) Supervised learning (지도 학습)

- 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계 학습(Machine Learning)의 한 방법.
- Labeled된 데이터를 기반으로 학습하여 알고리즘 모델을 만들고, Unlabeled된 데이터의 Label을 예측.





2) Supervised learning 예시

- 아래 그림은 'Tumor size와 Age'을 기반으로 Benign or Malignant인지 분류하는 Classification 모델이다.

- 이 Classification 모델은 Benign, Malignant로 Labeled된 Training sample로 만들어진 것이다.

- 만약, 하나의 Unlabeled된 Testing sample을 이 모델에 넣게되면, Testing sample의 'Tumor size와 Age'에 따라 분류가 될 것이다.

- 'Tumor size와 Age'가 Malignant와 유사하다면 Testing sample을 Malignant라 예측할 수 있다.






3) Supervised learning을 이용한 알고리즘

  • 서포트 벡터 머신 (support vector machine)
  • 은닉 마르코프 모델 (Hidden Markov model)
  • 회귀 분석 (Regression)
  • 신경망 (Neural network)
  • 나이브 베이즈 분류 (Naive Bayes Classification)




4) Supervised learning에서 참고사항

- Label 정보가 없다면, Unsupervised learning(비지도 학습) 알고리즘을 사용한다.

- Label 정보가 있더라도, Supervised learning 항상 최선의 선택은 아니다. 모든 Supervised learning 기법들이 Training set과 Testing set의 분포가 같을 것이라 가정하고 진행되므로, Training과 Testing 샘플이 전혀 다른 distribution을 가졌다면 모델과 예측 사이의 gap이 발생한다. 따라서 이를 보완하기 위해, Semi-supervised learning(준지도 학습)을 사용하기도 한다.

- 정리하자면, Supervised learning은 Training과 Testing 샘플이 유사한 Statistical properties 가질 때 진행하자.






#아래 내용을 참고했습니다

1) Libbrecht, M. W., & Noble, W. S. (2015). Machine learning applications in genetics and genomics. Nature Reviews Genetics, 16(6), 321.

2) https://ko.wikipedia.org/wiki/%EC%A7%80%EB%8F%84_%ED%95%99%EC%8A%B5





지도 학습(Supervised learning) End.

BioinformaticsAndMe

R, T-test (R, T검정) Start.

BioinformaticsAndMe





1) one sample t-test

- 한 변수의 평균이 특정값과 같은지를 알아보기 위한 방법.


> bmi.ttest <- t.test(bmi, mu=30)

> bmi.ttest


        One Sample t-test


data:  bmi

t = 5.3291, df = 199, p-value = 2.661e-07

alternative hypothesis: true mean is not equal to 30

95 percent confidence interval:

 31.45521 33.16479

sample estimates:

mean of x 

    32.31 

--- P value가 0.05 이하이므로 귀무가설 기각 -> 평균이 30보다 크다는 대립가설채택


> names(bmi.ttest)

[1] "statistic"   "parameter"   "p.value"     "conf.int"    "estimate"    "null.value"  "alternative" "method"      "data.name"  

statistic: 검정통계랑

parameter: 파라미터

p.value: p값





2) two sample t-test

- 서로 독립적인 두 집단의 평균의 차이가 있는지를 확인.

- 집단 사이의 등분산 여부에 따라 분석방법이 달라지므로 등분산 검정 필요.


# 두 집단의 등분산 검정 / '~'는 type이라는 factor값에 의해 분류

> var.test(bmi ~ type) 

        F test to compare two variances


data:  bmi by type

F = 1.7595, num df = 131, denom df = 67, p-value = 0.01115

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

 1.140466 2.637564

sample estimates:

ratio of variances 

           1.75945 

--- F 검정 결과 귀무가설을 기각하므로 등분산이 아님


> t.test(bmi ~ type) 


        Welch Two Sample t-test


data:  bmi by type

t = -4.512, df = 171.457, p-value = 1.188e-05

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

 -5.224615 -2.044547

sample estimates:

 mean in group No mean in group Yes 

         31.07424          34.70882 

--- 당뇨의 유무에 따라 bmi의 차이가 있다고 결론





3) Paired t-test

- 쌍을 이룬 두 변수의 차이를 보는 검정.


예제데이터: anorexia

Treat: Factor of three levels: "Cont" (control), "CBT" (Cognitive Behavior treatment) and "FT" (family treatment).

Prewt: Weight of patient before study period, in lbs.

Postwt: Weight of patient after study period, in lbs.


# 서로 독립적인 두 집단의 평균을 비교 (평균이 같다/ 같지않다)

> attach(anorexia)

> FT <- subset(anorexia, Treat=='FT')

> head(FT)

   Treat Prewt Postwt

56    FT  83.8   95.2

57    FT  83.3   94.3

58    FT  86.0   91.5

59    FT  82.5   91.9

60    FT  86.7  100.3

61    FT  79.6   76.7


> shapiro.test(FT$Prewt - FT$Postwt)


        Shapiro-Wilk normality test


data:  FT$Prewt - FT$Postwt

W = 0.9536, p-value = 0.5156

--- 정규분포를 따른다


> t.test( FT$Prewt, FT$Postwt, paired=TRUE )

        Paired t-test

data:  FT$Prewt and FT$Postwt
t = -4.1849, df = 16, p-value = 0.0007003
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -10.94471  -3.58470
sample estimates:
mean of the differences 
              -7.264706 

--- P-value가 유의수준 0.05보다 작기 때문에, 가족치료를 실행하기 전, 후의 차이가 0이 아니라고 결론 내릴 수 있다.
-> 가족치료 효과가 있다고 판단 가능.







R, T-test (R, T검정) End.

BioinformaticsAndMe



'R' 카테고리의 다른 글

pathview (패스웨이 분석)  (2) 2019.05.22
R, 파일 입출력 (FILE I/O)  (0) 2018.09.11
R plot (그래픽스)  (0) 2018.08.27
R 회귀분석 (R regression test)  (0) 2018.08.19
R apply 함수  (0) 2018.08.15

+ Recent posts