numpy&pandas KNN (K Nearest Neighbor) 알고리즘


numpy&pandas KNN (K Nearest Neighbor) 알고리즘

KNN은 따로 학습이라 부를만한 과정은 없습니다. 거리를 계산하고 정렬하는 것이 전부입니다. python과 numpy, pandas를 이용해 작성했습니다. 거리를 측정하는 방법에 유연성을 주고 싶어서 거리 함수를 직접 정의할 수 있게 만들었습니다. 아래는 유클리드, 맨해튼 거리의 함수입니다. import numpy as np def dist_Euclidean(a: np.ndarray, b: np.ndarray): return ((a-b)**2).sum() def dist_Manhattan(a: np.ndarray, b: np.ndarray): return np.abs(a-b).sum() knn: pandas.DataFrame을 입력받아 예측을 수행한다. 하나가 아닌 여러 데이터를 한 번에 처리하기 위해 내부 함수를 이용해 apply를 2번 실행했습니다. 예측 대상(여기선 Species)은 target_column으로 지정합니다. 그 외에 거리 계산에 사용될 컬럼들을 지정하려면 att...


#algorithm #k #knn #nearest #neighbor #numpy #pandas #python

원문링크 : numpy&pandas KNN (K Nearest Neighbor) 알고리즘