Credit Card : 신용카드 사용자 이탈 예측하기


Credit Card : 신용카드 사용자 이탈 예측하기

0. 서론 다음은 신용카드 사용자 이탈을 예측하는 것이다. 그런데... 사실 데이터셋이 어디서 나왔는지가 기억이 잘 안난다...^^;; (시간이 좀 지나서...) Competition에 참가하건 아니어서 기록도 따로 남아있지 않고... 그래도 Dataset에 대해 얘기하자면 이 Dataset은 신용카드 사용자들의 이탈과 관련된 데이터였다. 종속변수는 유지/이탈의 0/1로 나누어지는 Binary 변수였고 변인변수는 나이, 성별, 결혼 유무, 학력 수준, 소득의 범주형 변수와 가구 구성원 수, 은행과의 거래월 수, 신용카드 한도와 같은 연속형 변수 총 20개 정도 존재했다. 전체 데이터 수는 10,217개로 많지는 않았다. 이 Dataset을 통해 고객이 신용카드 사용을 유지할 것인지 or 그만 사용할것인지를 예측하는 모형을 만드는 것이 프로젝트의 목표다. 1. 데이터 관련 : 결측값(Missing Value) 채우기 먼저 데이터를 살펴보면 결측값이 존재하는 column이 몇몇 보였다....


#Classification #KNN #MissingValue #Python #Sampling #이탈예측

원문링크 : Credit Card : 신용카드 사용자 이탈 예측하기