[R 기초통계] 데이터 전처리(결측값, 이상치, 정렬, 분리, 선택) / is.na, na.omit, order, rank, split, subset, which


[R 기초통계] 데이터 전처리(결측값, 이상치, 정렬, 분리, 선택) / is.na, na.omit, order, rank, split, subset, which

데이터를 실제 분석하는 데 드는 시간을 얼마 걸리지 않는다. 오히려 대부분의 시간은 데이터를 분석할 수 있또록 편집하는데 소요된다. 이를 데이터 전처리라고 한다. 데이터를 확보했다고 하더라도 이를 바로 분석에 쓸 수 있는 경우는 드물다. 일반적인 데이터는 결측값이 있거나 이상치가 있을 수 있으며, 단위에 있어 차이가 있는 등 여러 데이터를 전처치를 진행해야 온전한 분석을 실시할 수 있다. 이 글에서는 R을 통해서 기본적으로 데이터를 전처리하는 과정과 명령어를 알아볼 것이다. 결측값 결측값이란 데이터셋에서 입력이 누락된 값을 말한다. R에서는 NA라는 값으로 표시된다. 결측값이 그대로 둔 상태에서 산술연산이 불가능하..........

[R 기초통계] 데이터 전처리(결측값, 이상치, 정렬, 분리, 선택) / is.na, na.omit, order, rank, split, subset, which에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.



원문링크 : [R 기초통계] 데이터 전처리(결측값, 이상치, 정렬, 분리, 선택) / is.na, na.omit, order, rank, split, subset, which