Bigdata study-1(normalization, 유사도, (비)지도학습)


Bigdata study-1(normalization, 유사도, (비)지도학습)

1. Normalization(1) min, max (2) 평균0, 분산1 (2)의 방법(가우시안 방식)을 더 선호함,수집한 데이터의 에러가 있는 경우 min, max가 많이 흔들리기 때문Ex. 168 170 172 180 -> 1.68 170 172 1800 일 경우2. 데이터끼리의 유사도 판별(1) 거리가까우면 더 유사함(2)cosine similarity(유사도)-1일 수록 유사하지 않다!(feature 별로 normalize하면 -,+부호 모두 가능해지면서 볼수있음, Text mining에서 상대적으로 그 단어가 안 나타났다)Ex. 두 데이터간 유사도 구하기(cosine similarity)3. Supervised learning(1) Supervised learningtarget variable이 pair로 주어졌을 때,-regression-classification(2) Unsupervise..........



원문링크 : Bigdata study-1(normalization, 유사도, (비)지도학습)