Z-검정 (Z-test) Start

BioinformaticsAndMe






Z-검정


: Z-검정은 정규분포를 가정하며, 추출된 표본이 동일 모집단에 속하는지 가설 검증하기 위해 사용

: Z-score는 '모집단 평균' 및 '모집단 표준 편차' 의 매개 변수를 이용해 계산

*Null hypothesis(귀무 가설) - 표본 평균이 모집단 평균과 같음

*Alternate hypothesis(대립 가설) - 표본 평균이 모집단 평균과 같지 않음

: Z 검정 통계량값이 임계값(Critical value)보다 크고 작음에 따라, 가설을 기각 또는 채택하게 됨




Z-검정을 사용할 때?


ㄱ) 표본 크기가 30보다 큼 (30이하라면 T-test 사용)

ㄴ) 데이터가 서로 독립적 (하나의 데이터가 다른 데이터에 영향을 미치지 않고, 관련되지 않음)

ㄷ) 데이터가 정규분포 (그러나, 30보다 큰 대규모 표본에서는 중요하지 않음)

ㄹ) 각각의 데이터는 모집단에서 동일한 확률로 선택되야 함

ㅁ) 비교 검정에서는 샘플크기가 가능한 같아야 함




One-proportion Z-검정 (R 예제)


One-proportion Z-검정은 '실제 측정 비율'이 '예상 이론 비율'과 일치하는지 비교하기 위해 사용

: 예제로, 수컷과 암컷의 비율이 50%로 균등한 쥐 집단에서, 추출된 160마리에서 각각 95마리 수컷과 65마리 암컷의 암발생을 확인함

→ 우리는 암발생이 수컷 쥐에서 더 빈번한지 통계적으로 알고 싶다

# prop.test 함수 사용 (binom.test 함수도 가능)

res <- prop.test(x = 95, n = 160, p = 0.5, correct = FALSE) res

1-sample proportions test without continuity correction data: 95 out of 160, null probability 0.5 X-squared = 5.625, df = 1, p-value = 0.01771 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.5163169 0.6667870 sample estimates: p 0.59375

: 검정 결과 p-value 값이 0.01771으로 유의 수준인 alpha = 0.05보다 작음

따라서, 암발생 쥐의 비율이 모집단 0.5 비율과 유의하게 다르다는 결론을 내림







#Reference

1) https://towardsdatascience.com/statistical-tests-when-to-use-which-704557554740

2) https://influentialpoints.com/Training/the-z_test.htm

3) https://www.statisticshowto.datasciencecentral.com/z-test/

4) https://getcalc.com/statistics-z-test-statistic-calculator.htm

5) http://cfa-studynotes.blogspot.com/2008/11/t-statistic-vs-z-statistic.html

6) http://www.sthda.com/english/wiki/one-proportion-z-test-in-r





Z-검정 (Z-test) End

BioinformaticsAndMe

'Statistics' 카테고리의 다른 글

생존 분석 (Survival analysis)  (1) 2019.11.25
분산 분석 (ANOVA)  (0) 2019.11.04
경향분석 (Cochran-Armitage Trend test)  (0) 2019.10.22
피셔정확검정 (Fisher exact test)  (0) 2019.10.15
1종, 2종 오류 (Type 1, 2 error)  (0) 2019.10.07

+ Recent posts