[머신러닝] Error Analysis 오류 분석 :: 이메일 분류 예제 / stemming


[머신러닝] Error Analysis 오류 분석 :: 이메일 분류 예제 / stemming

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Machine Learning System Design 강의 내용을 정리한 것이다. 이번 강의에서는 스팸 메일 분류의 예시를 통해 실제 시스템을 구현하는데 있어 고려해야할 사항을 살펴본다. Building a Spam Classifier 스팸 분류기 생성하기 지도학습 x : 이메일의 특성 y : 스팸 메일(1) 또는 스팸 아닌 메일(0) spam/non-spam을 구별할 수 있는 단어 100개를 추려서, feature x를 그러한 단어가 email에 포함되어 있는지 여부를 나타내는 vector로 표현할 수 있다. spam/non-spam을 구별할 수 있는 단어가 deal, buy, Andrew(수신자 이름), now, ··· 등이라고 하자. 이메일 내용 이메일이 다음과 같이 주어졌다고 하자. 그러면 x'=[1 1 0 1 ···]으로 나타낼 수 있다. Buy...


#coursera #코세라머신러닝 #코세라 #이웃환영 #오류분석 #수치평가 #무료강의 #머신러닝무료강의 #머신러닝 #딥러닝 #대학생 #기계학습 #공부블로그 #공부 #stemming #통계학과

원문링크 : [머신러닝] Error Analysis 오류 분석 :: 이메일 분류 예제 / stemming