유전 알고리즘 (Genetic algorithm) Start

BioinformaticsAndMe








유전 알고리즘 (Genetic Algorithm)


: 유전 알고리즘(GA)은 존 홀랜드(John Holland)가 다윈 진화론의 적자생존에 기반하여 개발한 최적화 연산 방법(1975)

*진화론에서 언급되는 최종적으로 살아남는 종은 변화에 가장 발빠르게 적응하는 종

*https://bioinformaticsandme.tistory.com/52

: 생물의 진화를 모방한 진화 연산의 대표적인 기법 (탐색 알고리즘의 일종)

1) 문제에 대한 가능한 해(유전자)들을 나열

2) 유전자들을 변화시켜 높은 정확도를 가진 해들을 생성

3) 이런 유전자들의 변형으로 좋은 해를 얻는 것을 진화라 봄

: 실제 진화 연구에서 사용되는 여러 용어들을 사용 중

*세대(Generation), 인구(Population), 변이(Mutation), 교차(Crossover) 등









#Reference

1) https://www.youtube.com/watch?v=Yr_nRnqeDp0&list=PLHyv9ND8t5M2bDh9jjOiIewVf77bglZ2y&index=9

2) https://namu.wiki/w/%EC%9C%A0%EC%A0%84%20%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98

3) https://ko.wikipedia.org/wiki/%EC%9C%A0%EC%A0%84_%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98

4) https://www.youtube.com/watch?v=7ZDvt4to7vU&list=PLHyv9ND8t5M2bDh9jjOiIewVf77bglZ2y&index=10





유전 알고리즘 (Genetic algorithm) End

BioinformaticsAndMe

'Machine Learning' 카테고리의 다른 글

Support Vector Machine (SVM)  (0) 2020.02.05
딥러닝 서버 PC 구축  (0) 2020.01.22
구글 어시스턴트(Google Assistant)  (0) 2020.01.06
가짜얼굴 (This person does not exist)  (0) 2019.12.30
[TensorFlow] 심장질환 예측  (2) 2019.12.19

[R] Multiple linear regression (다중회귀분석) Start

BioinformaticsAndMe








Multiple linear regression (다중회귀분석)


: 다중회귀분석은 예측변수(독립변수;설명변수)가 2개 이상인 회귀분석

: 다중회귀분석에서 예측변수 개수가 많을 경우, 적절한 회귀모형 선택이 필요함

: 회귀모형에 포함되는 예측변수의 선정 기준

ㄱ) 반응변수(종속변수)와 높은 상관관계

ㄴ) 선택된 예측변수들은 서로 낮은 상관관계를 보임 (다중공선성 문제를 회피)

ㄷ) 예측변수의 개수는 적을수록 유리





Feature selection (변수 선택법)


1) All possible regressions

- 변수들의 가능한 모든 조합들로부터 최적의 모형을 찾아냄

- 유의한 변수가 누락되지 않는 안전한 방법

- 변수가 많을수록 탐색 시간이 급증함

2) Forward stepwise selection (Forward selection)

- 기여도가 높은 유의한 변수부터 하나씩 추가하는 기법

- 빠른 계산이 장점

- 이미 선택된 변수는 다시 제거되지 않음

3) Backward stepwise selection (Backward elimination)

- 모든 변수를 포함한 상태에서 불필요한 변수를 제거해나가는 방법

- 중요한 변수가 제외될 가능성이 매우 적음

- 이미 제외된 변수는 다시 선택되지 않음


         





1. 실습데이터 로딩


# MASS 패키지의 birthwt 데이터

library(MASS) str(birthwt)

'data.frame': 189 obs. of 10 variables: $ low : int 0 0 0 0 0 0 0 0 0 0 ... $ age : int 19 33 20 21 18 21 22 17 29 26 ... $ lwt : int 182 155 105 108 107 124 118 103 123 113 ... $ race : int 2 3 1 1 1 3 1 3 1 1 ... $ smoke: int 0 0 1 1 1 0 0 0 1 1 ... $ ptl : int 0 0 0 0 0 0 0 0 0 0 ... $ ht : int 0 0 0 0 0 0 0 0 0 0 ... $ ui : int 1 0 0 1 1 0 0 0 0 0 ... $ ftv : int 0 3 1 2 0 0 1 1 1 0 ... $ bwt : int 2523 2551 2557 2594 2600 2622 2637 2637 2663 2665 ...




2. 다중회귀분석 수행


■반응변수 - bwt(출생시 체중)

■예측변수 - age(엄마나이), lwt(엄마몸무게), race(인종), smoke(임신중흡연상태), ptl(과거조산횟수), ht(고혈압기왕력), ui(uterine irritability 존재여부) 

# race는 연속형 변수로 인식하므로, factor(race)로 사용해야함

model_1=lm(bwt ~ age+lwt+factor(race)+smoke+ptl+ht+ui, data=birthwt) summary(model_1)

Call: lm(formula = bwt ~ age + lwt + factor(race) + smoke + ptl + ht + ui, data = birthwt) Residuals: Min 1Q Median 3Q Max -1838.7 -454.5 57.6 465.1 1711.0 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2934.132 311.450 9.421 < 2e-16 *** age -4.093 9.440 -0.434 0.665091 lwt 4.301 1.722 2.497 0.013416 * factor(race)2 -488.196 149.604 -3.263 0.001318 ** factor(race)3 -353.334 114.319 -3.091 0.002314 ** smoke -351.314 106.180 -3.309 0.001132 ** ptl -47.423 101.663 -0.466 0.641443 ht -586.836 200.841 -2.922 0.003925 ** ui -514.937 138.483 -3.718 0.000268 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 648.7 on 180 degrees of freedom Multiple R-squared: 0.2424, Adjusted R-squared: 0.2087 F-statistic: 7.197 on 8 and 180 DF, p-value: 2.908e-08




3. 유의하지 않은 변수 제거


: 위 다중회귀분석 결과에서 age와 ptl 변수가 유의하지 않은 것으로 확인됨

: 아래의 3가지 방법 중 하나로, 유의하지 않은 변수를 제거할 수 있음

1) 유의하지 않은 변수를 누락하고 회귀모형을 새롭게 정의

model_2 = lm(bwt~ lwt+factor(race)+smoke+ht+ui, data=birthwt) 2) update 함수를 사용하여, 기존 회귀모형에서 유의하지 않은 변수 제거 model_2 = update(model_1, .~. -age-ptl) 3) step 함수를 사용하여, 기존 회귀모형에서 유의하지 않은 변수를 제거해나감

model_2 = step(model_1, direction = "backward") summary(model_2)

Call: lm(formula = bwt ~ lwt + factor(race) + smoke + ht + ui, data = birthwt) Residuals: Min 1Q Median 3Q Max -1842.14 -433.19 67.09 459.21 1631.03 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2837.264 243.676 11.644 < 2e-16 *** lwt 4.242 1.675 2.532 0.012198 * factor(race)2 -475.058 145.603 -3.263 0.001318 ** factor(race)3 -348.150 112.361 -3.099 0.002254 ** smoke -356.321 103.444 -3.445 0.000710 *** ht -585.193 199.644 -2.931 0.003810 ** ui -525.524 134.675 -3.902 0.000134 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 645.9 on 182 degrees of freedom Multiple R-squared: 0.2404, Adjusted R-squared: 0.2154 F-statistic: 9.6 on 6 and 182 DF, p-value: 3.601e-09




4. 회귀모델 비교 및 평가


: F-test 분산분석으로 두 회귀모형의 설명력을 비교하여, 첫 번째 회귀모형에서 제거된 변수들의 기여도를 평가함

# anova( 제거 전 모형, 제거 후 모형 )

anova(model_1, model_2)

Analysis of Variance Table Model 1: bwt ~ age + lwt + factor(race) + smoke + ptl + ht + ui Model 2: bwt ~ lwt + factor(race) + smoke + ht + ui Res.Df RSS Df Sum of Sq F Pr(>F) 1 180 75741025 2 182 75937505 -2 -196480 0.2335 0.792

 : F-test 결과 p-value가 0.792로 매우 크므로, 앞서 제거된 두 변수는 회귀모형에 대한 기여도가 적음을 알 수 있음

# summary 함수로 최종 회귀모형을 평가

summary(model_2)

Call: lm(formula = bwt ~ lwt + factor(race) + smoke + ht + ui, data = birthwt) Residuals: Min 1Q Median 3Q Max -1842.14 -433.19 67.09 459.21 1631.03 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2837.264 243.676 11.644 < 2e-16 *** lwt 4.242 1.675 2.532 0.012198 * factor(race)2 -475.058 145.603 -3.263 0.001318 ** factor(race)3 -348.150 112.361 -3.099 0.002254 ** smoke -356.321 103.444 -3.445 0.000710 *** ht -585.193 199.644 -2.931 0.003810 ** ui -525.524 134.675 -3.902 0.000134 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 645.9 on 182 degrees of freedom Multiple R-squared: 0.2404, Adjusted R-squared: 0.2154 F-statistic: 9.6 on 6 and 182 DF, p-value: 3.601e-09

 : R² 값이 0.2404 → 최종 회귀모형이 예측변수들의 24.04% 설명함





5. 다중공선성(Multicollinearity) 확인


: 다중공선성은 분산팽창지수(Variation Inflation Factor;VIF)라는 통계량을 사용하여 계산 가능

: 한 예측변수에 대해 VIF의 제곱근은 다중공선성의 정도를 나타냄

: VIF가 10을 넘으면(= GVIF^(1/(2*Df)) 값이 2를 넘으면), 다중공선성 문제를 보임

# VIF값은 car 패키지의 vif() 함수로 계산

install.packages('car')

library(car) vif(model_2)

GVIF Df GVIF^(1/(2*Df)) lwt 1.182676 1 1.087509 factor(race) 1.257687 2 1.058993 smoke 1.154755 1 1.074595 ht 1.073548 1 1.036122 ui 1.036844 1 1.018255

: vif 함수로 완성된 회귀모형을 검사했을 때, 다중공선성 문제는 없는 것으로 확인됨





6. 변수의 상대적 중요성


: 현재까지 사용한 변수들 중에서, 결과 예측에 가장 중요한 변수를 서열화할 수 있음

# 아래 코드는 Dr. Johnson 논문에 소개된 스크립트로, 변수의 상대적 중요도를 출력함

relweights <- function(fit,...){

R <- cor(fit$model) nvar <- ncol(R) rxx <- R[2:nvar, 2:nvar] rxy <- R[2:nvar, 1] svd <- eigen(rxx) evec <- svd$vectors ev <- svd$values delta <- diag(sqrt(ev)) lambda <- evec %*% delta %*% t(evec) lambdasq <- lambda ^ 2 beta <- solve(lambda) %*% rxy rsquare <- colSums(beta ^ 2) rawwgt <- lambdasq %*% beta ^ 2 import <- (rawwgt / rsquare) * 100 import <- as.data.frame(import) row.names(import) <- names(fit$model[2:nvar]) names(import) <- "Weights" import <- import[order(import),1, drop=FALSE] dotchart(import$Weights, labels=row.names(import), xlab="% of R-Square", pch=19, main="Relative Importance of Predictor Variables", sub=paste("Total R-Square=", round(rsquare, digits=3)), ...) return(import) }

# 변수의 상대적 중요도를 시각화

model_3 = lm(bwt~ lwt+race+smoke+ht+ui, data=birthwt) result = relweights(model_3, col="blue") result

# ggplot2을 사용하여, 변수의 상대적 중요도를 시각화

library(ggplot2) plotRelWeights=function(fit){ data<-relweights(fit) data$Predictors<-rownames(data) p<-ggplot(data=data,aes(x=reorder(Predictors,Weights),y=Weights,fill=Predictors))+ geom_bar(stat="identity",width=0.5)+ ggtitle("Relative Importance of Predictor Variables")+ ylab(paste0("% of R-square \n(Total R-Square=",attr(data,"R-square"),")"))+ geom_text(aes(y=Weights-0.1,label=paste(round(Weights,1),"%")),hjust=1)+ guides(fill=FALSE)+ coord_flip() p } plotRelWeights(model_3)








#Reference

1) http://rstudio-pubs-static.s3.amazonaws.com/189354_277dfb3a83a34a2abaae855b90fcf269.html

2) http://brokerstir.com/multiple-linear-regression-intuition/

3) https://quantifyinghealth.com/stepwise-selection/

4) https://slidesplayer.org/slide/11708770/

5) https://rpubs.com/cardiomoon/190997

6) http://leoslife.com/archives/3874

7) Johnson(2000, Mutilvariate BehavioralResearch, 35,1-19)






[R] Multiple linear regression (다중회귀분석) End

BioinformaticsAndMe



'R' 카테고리의 다른 글

[R] Function (사용자 정의 함수)  (0) 2020.02.03
[R] Logistic regression (로지스틱 회귀분석)  (0) 2020.01.21
[R] ChIP-seq 분석  (1) 2020.01.05
[R] Circos plot  (0) 2019.12.30
[R] ggplot2  (0) 2019.12.16

동물 바이러스 (Animal virus) Start

BioinformaticsAndMe







동물 바이러스 (Animal virus)


: 동물 바이러스는 증식을 위해 숙주세포에 전적으로 의존하기 때문에, 세포 내 절대 기생체(Obligate parasite)라 불림

: 바이러스는 복제를 위해 숙주세포의 인프라를 이용하고, 현재 숙주세포 떠나 다른 숙주세포를 감염시킴

: 동물 바이러스는 단백질 껍질인 캡시드(Capsid)와 내부의 유전물질(RNA 또는 DNA)로 이루어짐

*또한, 지질로 이루어진 Envelope을 가질 수 있음




동물 바이러스 분류


: Baltimore system은 아래의 기준으로 바이러스를 7개 그룹으로 분류함

ㄱ) 사용된 유전물질(DNA, RNA)

ㄴ) 단일가닥(Single strand) 또는 이중가닥(Double strand)

ㄷ) 바이러스가 mRNA를 만드는 과정


Baltimore classification

GroupCharacteristicsMode of mRNA productionExample
IDouble-stranded DNAmRNA is transcribed directly from the DNA templateHerpes simplex (herpesvirus)
IISingle-stranded DNADNA is converted to double-stranded form before RNA is transcribedCanine parvovirus (parvovirus)
IIIDouble-stranded RNAmRNA is transcribed from the RNA genomeChildhood gastroenteritis (rotavirus)
IVSingle stranded RNA (+)Genome functions as mRNACommon cold (picornavirus)
VSingle stranded RNA (-)mRNA is transcribed from the RNA genomeRabies (rhabdovirus)
VISingle stranded RNA viruses with reverse transcriptaseReverse transcriptase makes DNA from the RNA genome; DNA is incorporated into the host genome; mRNA is transcribed from the incorporated DNAHuman immunodeficiency virus (HIV)
VIIDouble stranded DNA viruses with reverse transcriptaseThe viral genome is double-stranded DNA, but viral DNA is replicated through an RNA intermediate; the RNA may serve directly as mRNA or as a template to make mRNAHepatitis B virus (hepadnavirus)



인플루엔자 (Influenza)


: 인플루엔자는 독감의 원인이 되는 바이러스

: 바이러스가 감염되면 인후염/고열/두통/몸살 등을 유발함

: 리렌자(Relenza), 타미플루(Tamiflue) 등은 독감치료제로 사용




레트로바이러스 (Retrovirus)


: 대표적으로 알려진 레트로바이러스는 인간에 감염되는 HIV(Human Immunodeficiency Virus)가 존재

*이 바이러스가 에이즈(AIDS;Acquired Immune Deficiency Syndrome)를 유발함

: HIV는 사람과 사람 사이에서 전염되며, 체내의 면역세포를 파괴함

: HIV 감염인은 HIV에 감염되었지만, 일정한 면역세포를 유지하며 뚜렷한 증상이 없는 상태

: 에이즈 환자는 HIV에 감염되어 시간이 흐른 뒤, 특정 수치 아래로 면역세포가 급갑하며 에이즈 관련 증상을 보이는 상태




#Reference

1) https://www.thoughtco.com/animal-viruses-373890

2) https://www.khanacademy.org/science/biology/biology-of-viruses/virus-biology/a/animal-viruses-hiv

3) https://ko.wikipedia.org/wiki/%EB%B0%94%EC%9D%B4%EB%9F%AC%EC%8A%A4

4) https://cnx.org/contents/GFy_h8cu@10.61:eKpzNT3R@4/Viral-Evolution-Morphology-and

5) http://www.virology.ws/2009/04/30/structure-of-influenza-virus/

6) http://www.aids.or.kr/bbs/content.php?co_id=sub04_01

7) https://commons.wikimedia.org/wiki/File:Symptoms_of_acute_HIV_infection.svg





동물 바이러스 (Animal virus) End

BioinformaticsAndMe



'Biology' 카테고리의 다른 글

Necrosis vs Apoptosis  (0) 2020.01.20
신장 (콩팥, Kidney)  (0) 2020.01.16
호르몬 (Hormone)  (0) 2020.01.09
월경주기 (Menstrual cycle)  (0) 2020.01.06
진핵생물 vs 진정세균 vs 고세균  (0) 2020.01.06



Job Description

Agilent's Diagnostics and Genomics Group is seeking an enthusiastic, people-oriented Pre-/Post-Sales Field Applications Scientist (FAS) to provide wet-lab, data analysis, and technical education for our genomics workflow solutions in translational research and clinical laboratory environments. The primary role of this position is to partner with the sales organization and serve as the scientific/technical expert to help drive sales and provide support for new and existing customers.

Significant technical expertise in Next-Generation Sequencing (NGS) applications and bioinformatics is required. This includes, but is not limited to, DNA/RNA sample quality control, target enrichment panel design, preparation of sequencing libraries, and deep expertise in NGS data analysis for the purpose of supporting variant interpretation. Familiarity with the regulatory and diagnostics needs of the clinical laboratory environment is preferred.

As the primary technical liaison between our customers and our field sales team, the pre- and post-sales responsibilities for this FAS role include:

  • Maintaining up-to-date knowledge of clinical genomics trends, laboratory methods, technologies and data analysis techniques. Subject matter expert for practical implementation.
  • Providing scientific/technical consultation to customers in partnership with the sales team
  • Working with key opinion leaders (KOLs) to develop targeted SureSelect panels for Cancer and human inherited diseases, facilitating success from clinical research through to Clinical Routine.
  • Providing remote and/or on-site troubleshooting for NGS results, including sequencing quality metrics, data analysis pipelines, and the associated workflow variables (wet lab, sample QC, filters, etc) that could impact NGS results.
  • Competently delivering scientific/technical presentations and training to external customers, internal personnel, and at marketing events/conferences.
  • Maintaining close alignment with local sales partners, management, R&D and product marketing to communicate voice-of-customer feedback.
  • Proactively partnering with sales and technical support teams to ensure customer support needs are achieved in a timely manner
  • Ensuring that post-sales applications support enquiries and complaints are documented and logged according to regulatory and quality policies.


Qualifications
  • Master's degree (Ph.D. preferred) in Bioinformatics, Genetics, Genomics, Biochemistry, Molecular Biology, or equivalent biological field. 1-3 years of Post-doctoral experience is desirable.
  • Deep expertise in the NGS laboratory workflow, targeted gene panel design and NGS data analysis using various software tools.
  • Minimum of 3-5 years of practical laboratory experience in a Molecular Biology field. Direct experience working in Cancer translational research and/or clinical laboratories preferred.
  • Excellent oral and written communication skills, including strong interpersonal and organizational skills. English speaking skills required.
  • Must be able to work well independently and as part of an integrated/cross-functional team.
  • Requires flexibility in working hours and availability to travel for business ~20-30%.



#한국애질런트테크놀로지스 채용 홈페이지

http://www.jobkorea.co.kr/Search/?stext=bioinformatics

상대위험도(Relative Risk) vs 오즈비(Odds Ratio) Start

BioinformaticsAndMe








1. 상대위험도(Relative Risk;RR) vs 오즈비(Odds Ratio;OR)


: 상대위험도 및 오즈비는 질병발생과 위험인자의 상호 연관성 연구에서 사용되는 통계학적 개념

: 그러나, 각각은 서로 다른 개념임에도 불구하고, 자료 해석 과정에서 쉽게 혼용됨

*상대위험도 - 두 확률(Probability)의 비율

*오즈비 - 두 오즈(Odds)의 비율





2. 상대위험도(Relative Risk;RR)


: 위험인자에 노출된 암환자의 확률 =  a/(a+b) = R1

: 위험인자에 노출되지 않은 암환자의 확률 =  c/(c+d) = R2

Relative Risk(Risk Ratio) = R1/R2 = 'a/(a+b)' / 'c/(c+d)'

→ 위험인자에 노출된 사람은 암에 걸릴 확률이 2.54배 더 높음


: 상대위험도는 직관적으로 임상적 의미를 이해할 수 있음

: 일반적으로 코호트 연구(Cohort study)에 주로 사용

*코호트 연구는 일반적으로 전향적(Prospective)지만, 후향적(Retrospective) 연구도 가능함





3. 오즈비(Odds Ratio;OR)


: 오즈(Odds)는 어떤 사건이 일어날 가능성으로 P/(1-P)으로 표현됨

*오즈(Odds) = 성공확률/실패확률

: 위험인자에 노출된 사람 중에서 암환자인 오즈값 = a/b = Odds1

: 위험인자에 노출되지 않은 사람 중에서 암환자인 오즈값 =  c/d = Odds2

Odds Ratio(오즈비;교차비;승산비) Odds1/Odds2 = 'a/b' / 'c/d'

→ 위험인자에 노출된 사람은 노출되지 않은 사람에 비해 4.32배 정도로 더 암에 걸리는 경향을 보임


: 오즈비는 샘플링에서 생길 수 있는 Bias를 최소화하여, 통계적 의미를 강화함

: 일반적으로 환자대조군 연구(Case-Control study)에 주로 사용

*환자대조군 연구는 후향적(Retrospective) 연구



4. 상대위험도, 오즈비 계산기


https://www.socscistatistics.com/biostatistics/default2.aspx






#Reference

1) https://www.theanalysisfactor.com/the-difference-between-relative-risk-and-odds-ratios/

2) https://www.researchgate.net/figure/Calculation-of-odds-ratios-OR-and-relative-risk-RR-derived-from-Hels-et-al-2011_fig1_249313828

3) https://snowple.tistory.com/331

4) https://dermabae.tistory.com/185

5) https://www.socscistatistics.com/biostatistics/default2.aspx

6) https://www.mayoclinic.org/diseases-conditions/cancer/multimedia/relative-risk/img-20006446

7) https://www.slideshare.net/tarekksalem1966/odds-ratios-basic-concepts





상대위험도(Relative Risk) vs 오즈비(Odds Ratio) End

BioinformaticsAndMe

'Statistics' 카테고리의 다른 글

중심극한정리 (Central limit theorem)  (1) 2020.01.03
신뢰구간 (Confidence Interval)  (0) 2019.12.17
분위수 (Quantile)  (0) 2019.12.11
이산분포 (Discrete distribution)  (0) 2019.12.04
생존 분석 (Survival analysis)  (1) 2019.11.25


대웅제약 인실리코연구팀 경력사원 모집

채용유형

수시

근무지

서울 삼성동 대웅제약 본사

모집부문

연구

세부직무

인공지능 기반 신약연구

주요업무

   1. 데이터 분석 기반 약물 예측 모델 개발
       - Bioinformatics tool 및 Open DB 활용
       
- DB 관리 (PostreSQL 등)

   2. 머신러닝, 딥러닝 분석 방법 구축
       - Python (Tensorflow, Pytorch) 활용
       
- 신약개발 머신러닝 알고리즘 개발

   3. 인공지능 신약기술 중개연구
       - ML/DL 기술 (CNN, GAN, RL 등) 기반 신약연구
       - 생명/화학정보학 기반 신약연구

인재상

   대웅의 인재상인 "학습, 소통, 실행, 성장"의 역량을 갖추어야 합니다.

   1. 큰 목표를 가지고 꾸준히 학습하는 사람.
   2. 오픈된 마인드로 주변인과 소통하는 사람.
   3. Win-Win-Win의 마음으로 협력하는 사람.
   4. 원칙을 세우고 끝까지 실행하는 사람.

지원자격
우대사항

   [지원자격]

   1. 컴퓨터/시스템공학, 전자공학, 생명/화학정보학 관련 분야 석/박사 학위 소지자 또는 그에 준하는 경험 소지자
   2. Python, R 등 분석 프로그래밍 언어 1개 이상 활용 숙련가
   3. 머신러닝, 딥러닝에 대한 개념 이해 및 구축 경험 소지자

   [우대사항]

   1. ML/DL 연구논문 보유자
   2. 생명/화학정보학 기반 신약연구 실무경험 소지자
   3. 신기술이나 다양한 오픈 소스의 활용, 연구 구현, 관련 스터디에 적극적인 분

접수기간

   2020년    일 ~ 채용시 마감

지원방법

  온라인 접수 (우편 및 방문접수 불가) : 대웅제약 채용홈페이지 (https://daewoong.recruiter.co.kr)에서 작성 

전형절차

  서류전형 → 인적성검사 → 면접전형 → 채용신체검사 및 처우산정 → 최종입사

기타사항

  국가보훈대상자 및 장애인은 우대하여 채용합니다.
  Global Healthcare 그룹 대웅제약은 비흡연자 채용을 우대합니다. 
  기타 문의사항은 대웅제약 인사팀 ( recruit_dw@daewoong.co.kr )으로 연락바랍니다.



#대웅제약 채용 홈페이지

https://daewoong.recruiter.co.kr/app/jobnotice/view?systemKindCode=MRS1&jobnoticeSn=23284

호르몬 (Hormone) Start

BioinformaticsAndMe







호르몬 (Hormone)


: 호르몬(Hormone)은 신체의 내분비기관에서 생성되어, 몸 전체로 확산되는 화학물질

: 각각의 호르몬은 특이적 수용체가 있는 표적세포에만 반응함

*특정 수용체가 없는 세포는 호르몬에 반응하지 않음

: 호르몬은 길항작용(Antagonism) 및 되먹임작용(Feedback)을 통해, 체내의 균형을 유지

*양이 넘치면 과다증, 부족하면 결핍증을 보임

: 분자량이 작고 종특이성이 없으므로, 다른 동물의 호르몬을 사람에게 사용 가능

: 호르몬은 펩티드/아민(아미노산유도체)/스테로이드 계열로 구분됨





1. 시상하부 호르몬 (Hypothalamic hormone)


: 시상하부는 뇌의 일부분으로 항상성(Homeostasis) 조절의 중추임

ㄱ) Corticotropin Releasing Hormone(CRH) - 부신피질 자극 호르몬 방출 호르몬

ㄴ) Thyrotropin Releasing Hormone(TRH) - 갑상전 자극 호르몬 방출 호르몬

ㄷ) Growth Hormone Releasing Hormone(GHRH) - 성장 호르몬 방출 호르몬

ㄹ) Growth Hormone Inhibiting Hormone(GHIH) - 성장 호르몬 억제 호르몬

ㅁ) Gonadotropin Releasing Hormone(GnRH) - 고나도트로핀 방출 호르몬

ㅂ) Prolactin Releasing Factor(PRF) - 프로락틴 방출 호르몬

ㅅ) Prolactin Inhibiting Factor(PIF) - 프로락틴 방출 억제 호르몬

ㅇ) Melanocyte Stimulating Hormone Releasing Hormone(MSHRH) - 멜라닌 세포 자극 호르몬 방출 호르몬

ㅈ) Melanocyte Stimulating Hormone Releasing Inhibiting Hormone(MSHRIH) - 멜라닌 세포 자극 호르몬 방출 억제 호르몬




2. 뇌하수체 전엽 호르몬 (Anterior pituitary gland hormone)


: 뇌하수체 전엽은 입천장 상피 조직에서 유래한 분비선으로, 시상하부 호르몬의 자극을 받아 새로운 호르몬을 생성함

ㄱ) Adrenocorticotropic Hormone(ACTH) - 부신피질 자극 호르몬

ㄴ) Growth Hormone(GH) - 성장 호르몬

ㄷ) Thyroid Stimulation Hormone(TSH) - 갑상선 자극 호르몬

ㄹ) Prolactin Hormone(PRL) - 프로락틴 호르몬

ㅁ) Follicle Stimulating Hormone(FSH) - 여포 자극 호르몬

ㅂ) Luteinizing Hormone(LH) - 황체 형성 호르몬

ㅅ) Melanocyte Stimulating Hormone(MSH) - 멜라닌 세포 자극 호르몬

ㅇ) Endorphin Hormone - 엔도르핀(엔케팔린)




3. 뇌하수체 후엽 호르몬 (Posterior pituitary gland hormone)


: 뇌하수체 후엽은 시상하부가 아래로 돌출한 신경조직으로, 시상하부에서 생성된 호르몬을 저장함 (자체 생산 x)

ㄱ) Antidiuretic Hormone(ADH) - 항이뇨 호르몬(바소프레신)

ㄴ) Oxytocin - 옥시토신 호르몬




4. 갑상샘 호르몬 (Thyroid hormone)


: 후두 아래에 나비 넥타이 모양인 갑상선에서 분비되는 티로신과 요오드로 이루어진 호르몬

ㄱ) Triiodothyronine(T3) - 삼요오드티로닌

ㄴ) Thyroxine(T4) - 티록신

ㄷ) Calcitonin - 칼시토닌




5. 부갑상샘 호르몬 (Parathyroid hormone;PTH)


: 갑상선 등 쪽 표면에 위치한 네 개의 작은 조직인 부갑상선에서 분비되는 호르몬

ㄱ) Parathormone - 파라토르몬



6. 이자 호르몬 (Pancreatic hormone)


: 이자(췌장) 호르몬은 내분비 세포 집단의 랑게르한스 섬이 분비하는 대사조절 호르몬

ㄱ) Insulin - 인슐린(혈액 내 포도당 농도를 낮춤)

ㄴ) Glucagon - 글루카곤(혈액 내 포도당 농도를 높임)

ㄷ) Somatostatin - 소마토스타틴(인슐린, 글루카곤 억제)




7. 부신 피질 호르몬 (Adrenal cortical hormone)


: 부신 피질에서 분비되는 스테로이드 계열의 호르몬

ㄱ) Cortisol - 코르티솔(당질 코르티코이드)

ㄴ) Aldosterone - 알도스테론(무기질 코르티코이드)

ㄷ) Androgen - 안드로겐(남성호르몬, 에스트로겐전구체)




8. 부신 수질 호르몬 (Adrenal medullary hormone)


: 부신 수질에서 분비되는 카테콜아민 계열의 호르몬

ㄱ) Adrenaline - 아드레날린(에피네프린, 노르에피네프린)






#Reference

1) https://namu.wiki/w/%ED%98%B8%EB%A5%B4%EB%AA%AC

2) https://ko.wikipedia.org/wiki/%ED%98%B8%EB%A5%B4%EB%AA%AC

3) https://www.jagranjosh.com/general-knowledge/list-of-important-hormones-and-their-functions-1516176713-1

4) http://www.labpedia.net/test/404

5) https://basicmedicalkey.com/hypothalamic-and-pituitary-drugs/

6) http://fblt.cz/en/skripta/xi-regulacni-mechanismy-1-endokrinni-regulace/5-hormony-stitne-zlazy-a-pristitnych-telisek/

7) https://pressbooks.bccampus.ca/advancedanatomy1sted/chapter/thyroid-and-parathyroid-glands/






호르몬 (Hormone) End

BioinformaticsAndMe



'Biology' 카테고리의 다른 글

신장 (콩팥, Kidney)  (0) 2020.01.16
동물 바이러스 (Animal virus)  (0) 2020.01.13
월경주기 (Menstrual cycle)  (0) 2020.01.06
진핵생물 vs 진정세균 vs 고세균  (0) 2020.01.06
전사인자 (Transcription factor)  (0) 2020.01.02

[Python] PyMongo 데이터베이스 만들기 Start

BioinformaticsAndMe







MongoDB 데이터베이스 생성


: MongoDB에서 데이터베이스를 생성하기 위해, MongoClient 오브젝트 생성

*'정확한 IP' 및 'DB 이름'을 갖는 연결 URL 설정

: 해당 데이터베이스가 존재하지 않는다면, 아래 명령어로 데이터베이스를 생성하고 연결하게 됨

# 'mydatabase'라 불리는 데이터베이스 생성

import pymongo myclient = pymongo.MongoClient("mongodb://localhost:27017/") mydb = myclient["mydatabase"]




데이터베이스 존재 확인


: MongoDB에서 데이터베이스(DB)는 Content를 얻을 때까지 생성되지 않음

: 따라서, Collection과 Document를 먼저 생성해야지만, 데이터베이스의 존재를 확인할 수 있음


# 사용중인 시스템의 모든 데이터베이스를 출력

import pymongo myclient = pymongo.MongoClient('mongodb://localhost:27017/') print(myclient.list_database_names())

['admin', 'local', 'mydatabase']

# 특정 DB가 존재하는지 확인 (앞서 생성한 'mydatabase')

import pymongo myclient = pymongo.MongoClient('mongodb://localhost:27017/') dblist = myclient.list_database_names() if "mydatabase" in dblist:

print("The database exists.")

The database exists.






#Reference

1) https://www.w3schools.com/python/python_mongodb_getstarted.asp

2) https://www.mdpi.com/1999-5903/11/4/83/htm






[Python] PyMongo 데이터베이스 만들기 End

BioinformaticsAndMe

'Python' 카테고리의 다른 글

[Python] PyMongo collection 만들기  (0) 2020.01.16
[Python] PyMongo 설치  (0) 2020.01.02
[Python] File Handling  (0) 2019.12.17
[Python] 표준 입력 (User Input)  (0) 2019.12.12
[Python] 파이썬 함수 (Function)  (0) 2019.12.05




지원자격 
○ 국가공무원법 제33조의 결격사유가 없는 자
○ 해외여행에 결격사유가 없는 자
○ 병역의무대상자의 경우 병역을 필하였거나 면제된 자
   *단 KIST에서 전문연구요원으로 복무중인 자는 지원 가능
○ 공공기관에서 부정한 방법으로 채용된 사실이 없는 자
모집부문, 인원 및 분야 
○ 모집부문 및 인원 : 박사급 연구부문, 25명 이내
○ 모집분야
 
구 분세부 연구분야
뇌과학- 뇌 기능 및 질환 원인 규명, 신경회로 관련 신기술
- 계산뇌과학 분야
- 신경줄기세포 응용분야
- 마이크로센서, MEMS, 뇌공학 및 마이크로시스템 관련 분야
- 뇌질환/신경 화학적 영상제와 치료제의 생물학적 검증
의공학- 의료 빅데이터 분석 및 활용기술
- 장애극복을 위한 재활기술
- 인체삽입형 소자의 전자/광학/화학 센서 기술
- 표적항암제 및 면역항암치료 기술
청정
신기술
- 수전해/연료전지용 소재 및 시스템 기술
- 수소저장 소재 및 모듈 기술
- 고체상 전기화학계면 박막공정 및 엔지니어링 기술
- 차세대 이차전지 소재(전해질, 전극, 분리막) 및 전지 설계 기술
차세대
반도체
- 뉴로모픽 전자재료/소자/시스템 기술
- 나노 스핀 동역학, 스핀 궤도 특성을 이용한 스핀소자
- 초고속 전자소자/비선형 광-전 소자, 광데이터 제어/분석/설계
- 양자컴퓨팅 및 양자통신, 양자정보이론
로봇·
미디어
- 지능로봇을 위한 핵심 원천 기술 및 시스템 기술 (제어/인식/인간로봇 상호작용 등)
- 영상 유도 의료로봇 시스템 기술
- 2D/3D 영상 및 미디어 기술
- AI 핵심 기술
미래융합
기술
- 멀티스케일 유-무기 하이브리드 촉매 활성 소재
- 광제어를 위한 포토닉스 재료 및 소자
- 오믹스 및 항체공학 기반 바이오마커 검출 기술
- 면역항암 및 의약화학 관련 모든 분야
- 극한 물성, 극한 환경 사용을 위한 소재 개발(에너지, 환경, 구조)
국가기반
기술
- 미세먼지 관련 대기환경과학
- 지능형 센서 정보처리를 위한 신호처리 및 데이터 학습 기술
- 생분해성 플라스틱 제조 및 폐플라스틱 자원화 기술
기술정책- R&D 경영, 전략
- 대형 R&D 기획
- 과학기술정책 일반
강릉분원
(*강릉시
근무가능자)
- 오믹스 데이터 기반 천연물 효능과 작용기전 규명 및 검증
- 천연물 소재의 정밀의학 적용을 위한 생물정보학
- 천연물에 의해 유발되는 생체 내 신호 전달 체계의 변화 분석 (mRNA/단백질체)
- 스마트팜 인공지능 제어 및 모델링
전북분원
(*완주군
근무가능자)
- 고분자 합성 및 특성 분석
- 고온탄소복합소재 제조기술
- 열가소성/열경화성 고분자수지의 합성 및 기계적 성형/물성해석
- 구조용 복합소재 멀티스케일 모델링
※ 모집분야별 중복지원 불가 
선발전형 
▶ 가. 절차개요 
채용공고 → 서류심사 → 자질검증세미나(전공면접) → 종합면접 → 신원조회, 채용신체검사 → 최종합격통보
→ 입원서류제출 → 인사발령 및 고용계약
※ 서류심사 합격자에 한하여 인성검사 별도시행
▶ 나. 전형절차 및 심사기준 
전형단계심사기준일정비고
서류심사● 기본자질
● 학업성취도
● 연구실적
● 연구원 중점 연구분야와의 부합성
  - 모집예정인원의 3배수 이내 선발
1월 하순
~2월 중순
(예정)
 
자질검증세미나
(전공면접)
● 인물(표현력, 태도, 장래성, 품성, 리더십,
            발전 가능성, 기타 자질)
● 전문지식(학위, 경력, 연구업적, 핵심역량, 
                  응용력 등)
● 기타(중점 연구분야와의 부합성, 창의력, 
            가치관 등)
-모집예정인원의 2배수 이내 선발
2월 중순
~ 3월 초순
(예정)
*심의대상자에 한하여
  인성검사 시행
종합면접● 인물(표현력, 태도, 장래성, 품성, 리더십, 
            발전 가능성, 기타 자질)
● 전문지식(학위, 경력, 연구업적, 핵심역량, 
                  응용력 등)
● 기타(중점 연구분야와의 부합성, 창의력, 
            가치관 등)
3월 중순
(예정)
 
신원조회
채용신체검사
 3월 하순
(예정)
 
※ 상기 전형일정은 진행 과정에서 변경될 수 있음 
▶ 다. 단계별 제출서류 
전형단계제출서류
서류심사○ 온라인 지원서
자질검증세미나
(전공면접)
○ 추천서 2부 이상
  *공통 : 최종학위(예정) 기관에서의 지도교수 추천서 1부(필수)
  *포닥 : 공통사항 외 포닥 기관에서의 추천서 1부(필수)
     (포닥이 아닐 경우, 공통사항 외 본인이 원하는 기관 추천서 제출 가능)
○ 연구실적 증빙자료 각 1부(사본)
○ 대학이상 성적증명서·학위(예정)증명서 각 1부(사본)
○ 이력서 1부 (자유양식)
○ Essay 1부 : 「해당분야 연구실적 및 향후 활동계획」(자유양식)
○ 경력(재직)증명서 (해당하는 경우)
※ 블라인드 채용 시행에 따라 위 제출서류 중 추천서, 성적/학위(예정)증명서,
  이력서는 사실 확인을 위한 목적으로만 활용되며 면접위원에게는 제공되지 않거나
  제공 시 블라인드 처리 후 제공됩니다.
종합면접○ 발표자료 : 해당분야 연구실적 및 향후 활동계획(PPT)
신원조회
채용신체검사
○ 관련 서류
※ 각 단계별 서류제출에 대하여는 이전단계 합격자에게 개별 통보/안내 예정임 
접수기간 및 접수방법 
가. 접수기간 : 2020.1.8.(수) 14:00 ~ 2020.1.23.(목) 17:00까지
나. 접수방법 : 온라인 접수
 
한국과학기술연구원 채용 홈페이지(http://onest-kist.saramin.co.kr) → 채용공고 및 입사지원
→ 입사지원서 작성 바로가기
기타 사항
 
가. 본 채용공고는「평등한 기회, 공정한 과정을 위한 공공기관 블라인드 채용」을 따릅니다.
나. 국가보훈대상자와 장애인은 증빙서류 제출 시 관계법령에 의거 우대합니다.
다. 해당분야에 적격자가 없는 경우 채용하지 않을 수 있습니다.
라. 온라인 지원서 제출 이후 진행되는 전형단계에서 필요한 모든 제출서류는 온라인(전자우편)으로만 접수하며,
   온라인 지원서 또는 제출서류에 허위사항이 발견될 경우 합격 또는 임용을 취소할 수 있습니다.
마. 채용 관련 청탁 등 부정한 방법에 의하여 채용전형에 응시하는 경우 합격 또는 임용을 취소할 수 있으며,
   향후 5년간 응시를 제한합니다.
바. 전형단계별 결과(합격/불합격 통지)는 온라인 지원서 상에 기재한 전자메일로 개별 안내합니다.
사. 신원조회 또는 채용신체검사 결과 부적격자는 합격처리 하지 않습니다. 끝.
 









#한국과학기술연구원 채용 홈페이지

https://onest-kist.saramin.co.kr/service/onest-kist/1588/applicant/apply/recruit_default.asp


질병 예측 인공지능 Start

BioinformaticsAndMe







1. FDNA (미국)


: FDNA 어린이의 얼굴 사진으로 희귀병을 예측하기 위해, NVIDIA의 CUDA 병렬 프로세싱과 cuDNN 라이브러리를 구축

: 알려진 유전 질환의 환자 얼굴 사진 및 임상적 특징을 기계학습으로 모델링

: 의사들은 구축된 모델을 사용하여, 환자의 희귀병을 조기 예측할 수 있음

https://www.fdna.com/





2. National Environment Agency (싱가폴 국립 환경청)


: 싱가폴 국립 환경청은 지역에서 확산될 수 있는 전염병을 예방하기 위한 프로젝트 수립

: 뎅기열(Dengue fever;모기를 통해 감염되는 열대 전염병) 발병 예측 머신러닝 알고리즘 제작

: 현지의 역대 기상 정보 및 뎅기열의 계절별 발생 패턴을 분석하여, 뎅기열 발병을 4개월 전 미리 예측 가능





3. Stanford Artificial Intelligence Laboratory (SAIL;스탠포드 인공지능 연구소)


: 피부 병변 이미지 사진을 딥러닝으로 학습시켜, 피부암의 양성과 악성을 구분 짓는 인공지능 모델 제작

*해당 모델은 이미지 판독 정확성이 피부과 전문의 정도로 높음

: 130,000 피부 질환 이미지(2,000개 질환군)를 Training set으로 사용

*오픈 DB와 지역병원에서 이미지 확보

https://ai.stanford.edu/









#Reference

1) https://www.fdna.com/

2) https://news.developer.nvidia.com/identify-rare-diseases-with-a-selfie/

3) https://venturebeat.com/2018/03/14/ai-could-help-fight-the-spread-infectious-disease-around-the-world/

4) https://blogs.nvidia.com/blog/2017/05/23/ai-app-skin-cancer-diagnosis/
5) https://ai.stanford.edu/
6) https://news.stanford.edu/2017/01/25/artificial-intelligence-used-identify-skin-cancer/





질병 예측 인공지능 End

BioinformaticsAndMe



'Healthcare Industry' 카테고리의 다른 글

건강 관리 인공지능  (0) 2020.01.17
헬스케어 챗봇(ChatBot)  (0) 2019.12.20
중환자실 인공지능 솔루션  (0) 2019.12.14
[Blockchain] 블록체인과 헬스케어 (3)  (0) 2019.12.05
[BIG 4] 헬스케어 생태계  (0) 2019.11.27

+ Recent posts