na.omit와 na.rm의 차이점, R 결측치 제거


na.omit와 na.rm의 차이점, R 결측치 제거

R 프로그래밍에서 결측치를 제거하는 두 가지 방법이 있다. 아래 두 코드를 보자. result %>% na.omit() %>% summarize(mean(x)) summarize(result, mean(x, na.rm=TRUE)) 이는 summarize를 이용해서 result에 들어있는 데이터 중 x라는 변수의 평균에 대한 요약 데이터를 가져오는 것이다. 하나는 na.omit을 이용해 결측치를 제외하였고, 다른 하나는 평균을 구할 때 na.rm=TRUE를 주어 결측치를 제외한 것이다. 그런데 두 결과는 같을 수도 있고, 다를 수도 있다. 다른 예시를 살펴보자. result <-data.frame(x=c(1,NA,3),y=c(4,5,4)) # a b #1 1 3 #2 NA 2 #3 5 2 위와 같은 데이터 프레임이 있다고 하자. 컬럼의 평균값을 계산하는 두 가지 방법을 살펴보자. colMeans(result,na.rm=TRUE) # a b #2.000000 4.333333 colMea...


#omit #r #rm #결측치 #프로그래밍

원문링크 : na.omit와 na.rm의 차이점, R 결측치 제거