안녕하세요. SW 개발자 쪼맹 입니다. 오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 데이터 전처리 입니다. [범주형 데이터 전처리] 범주형 데이터에는 명목형 자료와 순서형 자료가 있습니다. 저도 항상 헷갈리는 어려운 단어 인 것 같습니다. 명목형 자료는 nominal data 로 단순히 범주를 나타내는 데이터를 뜻 합니다. 값이 크고 작다는 개념이 없는 것 입니다. 예로 주민번호 / 혈액형 / 사번 등 을 생각 할 수 있습니다. 순서형 자료는 ordinal data 로 순서가 있는 데이터 입니다. 예로 학점 / 비만도 / 등급 등이 있을 것 같습니다. 범주형 데이터는 학습 데이터로 바로 이용할 수가 없습니다. 컴퓨터가 이해할 수 있는 데이터로 변환 되어야 합니다. 범주형 데이터를 전처리 한다고 하는데요. Label encoding 과 One hot encoding 방법이 존재 합니다. Label encoding 은 범주 값을 숫자로 변환하는 것을 말합니다. 예로 혈액...
#AI
#딥러닝
#머신러닝
#머신러닝쪼렙
#명목형
#범주형
#범주형데이터
#순서형
#왕초보AI
#왕초보코딩
#전처리
#standardscaler
#scaler
#AI기초
#DeepLearning
#discretization
#discretize
#labelencoding
#MachineLearning
#minmaxscaler
#onehotencoding
#outlier
#robustscaler
#프로젝트
원문링크 : [AI] 데이터 전처리 - 범주형 데이터(명목형, 순서형)