[Python] Label Encoding (파이썬 라벨 인코딩) 과 one-hot encoding(원핫 인코딩)


[Python] Label Encoding (파이썬 라벨 인코딩) 과 one-hot encoding(원핫 인코딩)

label encoding 라벨 인코딩(Label Encoding)은 범주형 데이터를 수치형 데이터로 변환하는 프로세스입니다. 인공지능 모델은 일반적으로 수치형 데이터를 입력으로 받아들입니다. 그러나 실제 데이터는 범주형 데이터(예: 색상, 카테고리, 상태 등)를 포함할 수 있습니다. 따라서, 이러한 범주형 데이터를 숫자로 인코딩해야 합니다. 이때 사용되는 것이 라벨 인코딩입니다. 라벨 인코딩은 각 범주형 값에 고유한 정수 레이블을 할당하는 것을 의미합니다. 예를 들어, "빨강", "파랑", "노랑"과 같은 세 가지 색상 범주가 있다면, 각각에 대해 0, 1, 2와 같은 숫자를 할당할 수 있습니다. Python에서는 scikit-learn 라이브러리의 LabelEncoder 클래스를 사용하여 라벨 인코딩을 수행할 수 있습니다. 다음은 scikit-learn을 사용한 라벨 인코딩의 간단한 예제입니다 from sklearn.preprocessing import LabelEncoder #...


#encoding #hot #label #one #python #라벨 #원핫 #인코딩 #파이썬

원문링크 : [Python] Label Encoding (파이썬 라벨 인코딩) 과 one-hot encoding(원핫 인코딩)