선형회귀모형, 로짓모형, 각종 머신러닝 모형 등을 구축하기 위해서 특정 범주형 변수(categorical variable)을 더미변수로 만들어야 하는 경우가 많습니다. 그때마다 연구자들은 이런 함수들을 만들었는데... 이런 더미변수를 만들기 위한 함수를 일일히 만들어 함수로 저장한 뒤 그 함수들을 .apply()를 이용해 데이터프레임에 적용하여 일일히 더미변수 컬럼을 만들어내야 했습니다. 범주형 변수의 개수와 각 변수 내의 값의 종류에 따라서 함수가 많아지는 문제가 있었습니다. 이 과정에서 실수로 함수를 잘못 입력해서 잘못된 더미변수가 만들어지기도 합니다. 하지만, pandas는 정말 감사하게도 범주형 변수를 더미변수로, 더미변수를 범주형 변수로 만드는 기능도 제공하고 있습니다. 본 포스팅은 pandas 문서의 get_dummies()에 대한 정보를 국문으로 요약 정리한 것입니다. 1. 방법론 1) 코드 pd.get_dummies() 함수를 사용합니다. 이때, columns의 컬럼A...
#dummies
#파이썬
#자동생성
#로짓모형
#로짓모델
#더미변수생성
#더미변수
#python
#pandas
#logit
#get_dummies
#판다스
원문링크 : [Python] pandas :: get_dummies - 범주형 변수에서 더미변수를 자동으로 만들어주는 함수(categorical → dummy variable)