[AI] 데이터 전처리 - 범주형 데이터(명목형, 순서형)


[AI] 데이터 전처리 - 범주형 데이터(명목형, 순서형)

안녕하세요. SW 개발자 쪼맹 입니다. 오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 데이터 전처리 입니다. [범주형 데이터 전처리] 범주형 데이터에는 명목형 자료와 순서형 자료가 있습니다. 저도 항상 헷갈리는 어려운 단어 인 것 같습니다. 명목형 자료는 nominal data 로 단순히 범주를 나타내는 데이터를 뜻 합니다. 값이 크고 작다는 개념이 없는 것 입니다. 예로 주민번호 / 혈액형 / 사번 등 을 생각 할 수 있습니다. 순서형 자료는 ordinal data 로 순서가 있는 데이터 입니다. 예로 학점 / 비만도 / 등급 등이 있을 것 같습니다. 범주형 데이터는 학습 데이터로 바로 이용할 수가 없습니다. 컴퓨터가 이해할 수 있는 데이터로 변환 되어야 합니다. 범주형 데이터를 전처리 한다고 하는데요. Label encoding 과 One hot encoding 방법이 존재 합니다. Label encoding 은 범주 값을 숫자로 변환하는 것을 말합니다. 예로 혈액...


#AI #딥러닝 #머신러닝 #머신러닝쪼렙 #명목형 #범주형 #범주형데이터 #순서형 #왕초보AI #왕초보코딩 #전처리 #standardscaler #scaler #AI기초 #DeepLearning #discretization #discretize #labelencoding #MachineLearning #minmaxscaler #onehotencoding #outlier #robustscaler #프로젝트

원문링크 : [AI] 데이터 전처리 - 범주형 데이터(명목형, 순서형)