[R] 상자그림(Box plot) Start

BioinformaticsAndMe







1. 상자그림(Box plot)


: 상자그림은 특정한 수치 값을 기반으로 그려진, 자료 특성이 요약된 그래프

: 사분위수범위(Inter-Quartile Range;IQR) = Q1~Q3 = 상자그림몸통

: 중앙값(Median) = 상자그림몸통가운데선 = Q2(두번째사분위수)

: 최댓값(Maximum) = 위쪽 수염의 끝부분 (수염은 상자그림몸통 끝에 수직을 이룬 선)

: 최솟값(Minimum) = 아래쪽 수염의 끝부분

: 이상점(Outlier) = 최대최소를 벗어난 값 = 울타리(Fence) 바깥의 값 (Fence는 IQR x 1.5로 지정)

: 상자그림은 정규분포와 흡사

: 전체 분포 범위의 50%가 상자그림몸통에 포함됨

: 상자그림을 통해, 데이터의 분포를 확인하고 이상점을 처리하기 쉬움





2. R 상자그림 예제


# 뉴욕의 공기 퀄리티 예제 로딩

str(airquality)

'data.frame': 153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ... $ Wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ... $ Temp : int 67 72 74 62 56 66 65 59 61 69 ... $ Month : int 5 5 5 5 5 5 5 5 5 5 ... $ Day : int 1 2 3 4 5 6 7 8 9 10 ...

# 오존값으로 박스플롯 그리기

boxplot(airquality$Ozone)

# 상자그림 파라미터 지정

boxplot(airquality$Ozone,      main = "Mean ozone in parts per billion at Roosevelt Island",      xlab = "Parts Per Billion",     ylab = "Ozone",      col = "orange",     border = "brown",     horizontal = TRUE,        #수평 상자그림     notch = TRUE             #Notch(파인 형태) 상자그림 )

# 다중 상자그림 boxplot(Temp~Month,             data=airquality,             main="Different boxplots for each month",             xlab="Month Number",             ylab="Degree Fahrenheit",             col="orange",             border="brown" )





#아래 링크에서 'R 기본상자그림' 및 'ggplot2 상자그림'의 다양한 스크립트를 제공

https://www.r-graph-gallery.com/boxplot.html






#Reference

1) https://www.datamentor.io/r-programming/box-plot/

2) https://www.r-graph-gallery.com/boxplot.html

3) https://namu.wiki/w/%EC%83%81%EC%9E%90%20%EC%88%98%EC%97%BC%20%EA%B7%B8%EB%A6%BC







[R] 상자그림(Box plot) End

BioinformaticsAndMe



'R' 카테고리의 다른 글

[R] Circos plot  (0) 2019.12.30
[R] ggplot2  (0) 2019.12.16
[R] 파이차트(Pie plot)  (0) 2019.12.03
[R] 생존분석(Survival analysis)  (0) 2019.11.25
[R] 히스토그램(Histogram)  (0) 2019.11.18

+ Recent posts