코사인 유사도

요약: 두 벡터(데이터)간 사이의 각을 코사인 값으로 구해서 유사도 값을 구하는것 두 벡터가 동일(데이터 유사도가 높을수록)할 수록 값이 1에 가까워짐 공식 코사인 유사도 사용예시) 검색 엔진에서 검색어(Query)와 문서(Document)의 유사도를 구해서 가장 유사도가 높은 것을 먼저 보여주기 위한 기본 랭킹 을 위한 알고리즘으로 사용됩니다. 텍스트마이닝에서 쓰입니다. 검색엔진과 텍스트마이닝이 상당히 관련이 있기 때문에 사실 1번과 관련성이 깊습니다. 텍스트 마이닝은 흔히 벡터 스페이스 모델(Vector Space Model)을 사용하고 TF-IDF(Term Frequency – Inverse Document Frequency)를 사용하는데 단어집합들 간의 유사도를 구하기 위해서 코사인 유사도를 사용하는 것이 빈번하게 나옵니다. 그래서 word2vec 같은 딥러닝 모델에서도 나옵니다. 그 외에도 다른 분석이나 수리 모형에서도 유사도를 구할 때 사용합니다. 가끔 나옵니다. 매우 빈...

원문링크 : 코사인 유사도

등록된 다른 글

코사인 유사도

등록된 다른 글

psp 24번째 의뢰 하우징유격조정

psp 22번째 의뢰 벽돌복구

항공대 성관계 영상노출

유니티 IEnumerator 작동오류( yield return 이후로 동작 멈춤)

장고란? 개념 정리

???: 어? 말거네?

psp 36번째 의뢰 액정먼지청소

구조과정이 폭력적이여서 고소한 74세 할머니.gif

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티