[ML] LabelEncoder


[ML] LabelEncoder

사이킷런의 머신러닝 알고리즘은 문자열 값을 입력 값으로 허용하지 않기에 모든 문자열 값을 인코딩해서 숫자 형을 반환해야 한다. 레이블 인코딩 레이블 인코딩은 카테고리 feature를 코드형 숫자 값으로 변환하는 것이다. preprocessing에서 LabelEncoder를 import 하면 된다. items 배열이 있을 때 encode를 만들고 item을 encoder에 fit 시키면 label이 만들어진다. 문자열 값이 어떤 숫자로 인코딩 됐는지 보기 위해서는 classes_를 이용하면 된다. inverse_transform()을 통해서 인코딩된 값을 다시 디코딩 할 수 있다. transform에 들어갈 숫자의 순서, 길이는 상관없다 문제점 레이블 인코딩은 문자열 값을 숫자형 카테고리 값으로 변환..........



원문링크 : [ML] LabelEncoder