[Python] pandas :: get_dummies - 범주형 변수에서 더미변수를 자동으로 만들어주는 함수(categorical → dummy variable)


[Python] pandas :: get_dummies - 범주형 변수에서 더미변수를 자동으로 만들어주는 함수(categorical → dummy variable)

선형회귀모형, 로짓모형, 각종 머신러닝 모형 등을 구축하기 위해서 특정 범주형 변수(categorical variable)을 더미변수로 만들어야 하는 경우가 많습니다. 그때마다 연구자들은 이런 함수들을 만들었는데... 이런 더미변수를 만들기 위한 함수를 일일히 만들어 함수로 저장한 뒤 그 함수들을 .apply()를 이용해 데이터프레임에 적용하여 일일히 더미변수 컬럼을 만들어내야 했습니다. 범주형 변수의 개수와 각 변수 내의 값의 종류에 따라서 함수가 많아지는 문제가 있었습니다. 이 과정에서 실수로 함수를 잘못 입력해서 잘못된 더미변수가 만들어지기도 합니다. 하지만, pandas는 정말 감사하게도 범주형 변수를 더미변수로, 더미변수를 범주형 변수로 만드는 기능도 제공하고 있습니다. 본 포스팅은 pandas 문서의 get_dummies()에 대한 정보를 국문으로 요약 정리한 것입니다. 1. 방법론 1) 코드 pd.get_dummies() 함수를 사용합니다. 이때, columns의 컬럼A...


#dummies #파이썬 #자동생성 #로짓모형 #로짓모델 #더미변수생성 #더미변수 #python #pandas #logit #get_dummies #판다스

원문링크 : [Python] pandas :: get_dummies - 범주형 변수에서 더미변수를 자동으로 만들어주는 함수(categorical → dummy variable)