5-2주차: K-Nearest Neighbors


5-2주차: K-Nearest Neighbors

K-Nearest Neighbors (KNN) K-Nearest Neighbors (KNN)는 간단하지만 강력한 분류 알고리즘으로, 주어진 데이터의 유사도를 기반으로 분류를 수행합니다. 이 알고리즘은 Non-parametric이며, Lazy learning (또는 instance-based learning)에 속합니다. Lazy learning이란, 테스트 샘플이 주어지기 전까지 어떤 학습도 하지 않는 방식을 말합니다. KNN 알고리즘은 추가적인 추정방법 또는 모형이 없습니다. 대신 고려할 이웃 데이터 수 k와 거리 측정 metric만 결정하면 됩니다. 분류가 필요한 새로운 데이터가 생기면, 해당 데이터로부터 가장 가까운 k개의 데이터를 찾아 분류를 결정합니다. KNN 알고리즘의 동작 방식은 다음과 같습니다. 먼저, 분류하려는 데이터와 가장 가까운 k개의 데이터를 찾습니다. 이 때 거리 측정 metric을 사용하여 데이터 간 거리를 계산합니다. 그 다음, 이 k개의 데이터의 레이블을...



원문링크 : 5-2주차: K-Nearest Neighbors