Lec43. Machine Learning(머신러닝) – Machine Learning System Design_ Handling Skewed Data


Lec43. Machine Learning(머신러닝) – Machine Learning System Design_ Handling Skewed Data

위 포스팅은 Standford University : Machine Learning – Andrew Ng의 강의를 바탕으로 쓰여졌습니다.. https://www.coursera.org/learn/machine-learning/ 안녕하세요. 이번 시간에는 Skewed Data를 다루는 방법에 대해 알아보겠습니다. 아래 예시는 암 진단 알고리즘입니다. 예전 포스팅에서 봤듯이 binary classification 문제이며 가정 가 있고, y=1이면 암, y=0이면 암이 아닌 경우입니다. Test set을 통하여 가정 가 1%의 오차만 보이는 것을 발견하였습니다. 하지만 실제 집합에서는 0.5%만 암을 가진 환자가 있었습니다. 그래서 우리는 모든 가정의 결과값에 대하여 어떠한 y값이 나오던지 y=0으로 만드는 단순한 알고리즘을 만들..........



원문링크 : Lec43. Machine Learning(머신러닝) – Machine Learning System Design_ Handling Skewed Data