[R] 상자그림(Box plot) Start
BioinformaticsAndMe
1. 상자그림(Box plot)
: 상자그림은 특정한 수치 값을 기반으로 그려진, 자료 특성이 요약된 그래프
: 사분위수범위(Inter-Quartile Range;IQR) = Q1~Q3 = 상자그림몸통
: 중앙값(Median) = 상자그림몸통가운데선 = Q2(두번째사분위수)
: 최댓값(Maximum) = 위쪽 수염의 끝부분 (수염은 상자그림몸통 끝에 수직을 이룬 선)
: 최솟값(Minimum) = 아래쪽 수염의 끝부분
: 이상점(Outlier) = 최대최소를 벗어난 값 = 울타리(Fence) 바깥의 값 (Fence는 IQR x 1.5로 지정)
: 상자그림은 정규분포와 흡사
: 전체 분포 범위의 50%가 상자그림몸통에 포함됨
: 상자그림을 통해, 데이터의 분포를 확인하고 이상점을 처리하기 쉬움
2. R 상자그림 예제
# 뉴욕의 공기 퀄리티 예제 로딩
str(airquality)
'data.frame': 153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ... $ Wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ... $ Temp : int 67 72 74 62 56 66 65 59 61 69 ... $ Month : int 5 5 5 5 5 5 5 5 5 5 ... $ Day : int 1 2 3 4 5 6 7 8 9 10 ...
# 오존값으로 박스플롯 그리기
boxplot(airquality$Ozone)
# 상자그림 파라미터 지정
boxplot(airquality$Ozone, main = "Mean ozone in parts per billion at Roosevelt Island", xlab = "Parts Per Billion", ylab = "Ozone", col = "orange", border = "brown", horizontal = TRUE, #수평 상자그림 notch = TRUE #Notch(파인 형태) 상자그림 )
#아래 링크에서 'R 기본상자그림' 및 'ggplot2 상자그림'의 다양한 스크립트를 제공
https://www.r-graph-gallery.com/boxplot.html
#Reference
1) https://www.datamentor.io/r-programming/box-plot/
2) https://www.r-graph-gallery.com/boxplot.html
3) https://namu.wiki/w/%EC%83%81%EC%9E%90%20%EC%88%98%EC%97%BC%20%EA%B7%B8%EB%A6%BC
[R] 상자그림(Box plot) End
BioinformaticsAndMe
'R' 카테고리의 다른 글
[R] Circos plot (0) | 2019.12.30 |
---|---|
[R] ggplot2 (0) | 2019.12.16 |
[R] 파이차트(Pie plot) (0) | 2019.12.03 |
[R] 생존분석(Survival analysis) (0) | 2019.11.25 |
[R] 히스토그램(Histogram) (0) | 2019.11.18 |