Lending Club : Default 예측하기(Classification)


Lending Club : Default 예측하기(Classification)

0. 서론 Kaggle에서 Classification 관련해서 유명한 Dataset 중 하나인 Lending Club의 데이터이다. Lending Club은 미국의 대표적인 P2P 대출 기업으로 2007년부터 사업을 시작했다. 채무자와 채권자를 직접 연결해주는 온라인 서비스를 제공한다. 소비자 대출 및 소기업에 사업자를 대상으로 하며 구글의 투자를 받기도 했고 미국의 인터넷은행을 인수하기도 했다. 그러나 최근 P2P 대출기업들의 연체율 및 부실화에 대한 의문이 끊이지 않고 있고 이러한 의문을 해소하기 위해 대출자들의 부도를 정확하게 예측하는 것이 필요했다. 따라서 Lending Club의 데이터를 통해 부도(Default) 예측 모형을 만드는 것이 목표이다. 1. 데이터 소개 및 준비 데이터는 약 100만여개의 행과 300여개의 컬럼으로 구성되었다. 설명변수는 연속형 변수와 범주형 변수로 구성되었고 종속변수는 0, 1의 값으로 구분되었다. 데이터 EDA를 통해 이상치(Outlier)...


#Classification #Kaggle #LendingClub #Python

원문링크 : Lending Club : Default 예측하기(Classification)