R

[R] subset (데이터추출 함수)

MeDiscovery 2019. 10. 17. 18:07

[R] subset (데이터추출 함수) Start

BioinformaticsAndMe






subset (데이터추출 함수)


: subset 함수는 조건에 맞는 matrix 혹은 data.frame 결과를 추출

: 추출하고자 하는 조건이 복잡해질수록 구문이 길어지는 문제점을 보완하기 위한 함수

: 결측치가 포함된 데이터에서 에러를 쉽게 피할 수 있음

# iris 데이터에서 'setosa' 종 추출 result_1 <- subset(iris, Species=='setosa') head(result_1)

Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa

# Sepal.Length가 5를 넘고, 'setosa' 종 추출 result_2 <- subset(iris, Sepal.Length>5 & Species=='setosa') head(result_2)

Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa 11 5.4 3.7 1.5 0.2 setosa 15 5.8 4.0 1.2 0.2 setosa 16 5.7 4.4 1.5 0.4 setosa 17 5.4 3.9 1.3 0.4 setosa

# Sepal.Length가 5를 넘고, 'setosa' 종 추출한 데이터에서 select된 정보만 출력 result_3 <-subset(iris, Sepal.Length>5 & Species=='setosa', select=c('Petal.Length', 'Petal.Width', 'Species') ) head(result_3)




[R] subset (데이터추출 함수) End

BioinformaticsAndMe