피셔정확검정 (Fisher exact test) Start

BioinformaticsAndMe






피셔정확검정 (Fisher exact test)


: 피셔제곱검정은 범주형 데이터에서 초기하분포 기반의 정확한 p-value를 계산하는 방법

*초기하 분포(Hypergeometric distribution) - 모집단 비복원추출에서, 뽑은 n개 중 추출한 것이 x개인 확률변수 갖는 확률분포


: 샘플 수가 너무 적거나, 카테고리가 너무 많아서 테이블의 도수가 극도로 작아지는 상황에 주로 사용 

*구체적으로 기대빈도가 5 이하의 셀이 20%를 넘는 경우 피셔제곱검정 사용 (해당 조건에 카이제곱검정은 정확도 떨어짐)





피셔정확검정 R 예제


: 피셔정확검정의 예로서 한 바리스타가 '차를 먼저 따르고 우유를 나중에 넣는지, 우유를 먼저 따르고 차를 나중에 넣는지'의 문제

: 어느 것을 먼저 넣은 차인지 감별하는 바리스타의 능력이 통계적으로 유의한지 피셔정확검정 실시

*테스트를 반복할수록 바리스타 미각이 떨어지므로 총 10번의 실험 데이터를 얻음

추측

사실 

Milk first

Tea first

Milk first

 4

Tea first

 2


# 피셔정확검정을 위한 2x2 contingency matrix 생성 TeaTasting_matrix <- matrix( c(4,2,1,3), nrow=2 ) TeaTasting_matrix

[,1] [,2] [1,] 4 1 [2,] 2 3

# 피셔정확검정 함수 사용 fisher.test(TeaTasting_matrix)

Fisher's Exact Test for Count Data data: TeaTasting_matrix p-value = 0.5238 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.218046 390.562917 sample estimates: odds ratio 4.918388

# 피셔정확검정 결과 p-value가 0.5238로 유의하지 않으므로

   이 바리스타는 우유가 먼저인지, 차가 먼저인지 감별하는 능력이 있다고 보기 어려움







#Reference

1) http://work.thaslwanter.at/Stats/html/statsCategorical.html

2) https://litfl.com/fishers-exact-test/

3) https://slideplayer.com/slide/4937227/

4) https://www.scalelive.com/fishers-exact-test.html

5) https://techntalk.tistory.com/entry/%ED%94%BC%EC%85%94%EC%9D%98-%EC%A0%95%ED%99%95%EB%8F%84-%EA%B2%80%EC%A0%95Fishers-Exact-Probability-Test





피셔정확검정 (Fisher exact test) End

BioinformaticsAndMe

'Statistics' 카테고리의 다른 글

Z-검정 (Z-test)  (0) 2019.10.28
경향분석 (Cochran-Armitage Trend test)  (0) 2019.10.22
1종, 2종 오류 (Type 1, 2 error)  (0) 2019.10.07
카이제곱검정 (Chi square test)  (0) 2019.10.01
FDR (False Discovery Rate)  (1) 2019.09.23

+ Recent posts