[ElasticStack] 유사도 스코어 BM25, TF IDF, score


[ElasticStack] 유사도 스코어 BM25, TF IDF, score

유사도 스코어 쿼리 컨텍스트는 엘라스틱에서 지원하는 다양한 스코어 알고리즘 사용 가능 기본적으로는 BM25 알고리즘 이용해서 유사도 스코어 계산 유사도 스코어는 질의문과 Documen의 유사도를 표현하는 값 스코어가 높을수록 찾고자 하는 document의 가깝다는 사실을 의미 explain 옵션을 사용하면 스코어가 어떤 식으로 계산되는지를 알 수 있다. 쿼리 내부적인 최적화 방법과 어떤 경로를 통해 검색되었으며 어떤 기준으로 스코어가 계산되는지 score 계산식은 description 항목에 제공 스코어 알고리즘 BM25 쿼리 컨텍스트로 요청한 응답 값을 보면 hits된 Document는 _score 값을 가지고 있다. score는 document와 query 간의 연관성 수치로 값이 클수록 연관성이 높다 BM25 알고리즘은 검색, 추천에서 많이 사용되는 알고리즘 TF-IDF 개념에 문서 길이를 고려한 알고리즘 검색어가 문서에서 얼마나 자주 나타나는지, 검색어가 문서 내에서 중요한 ...


#BM25 #elasticSearch #elasticStack #IDF #score #TF

원문링크 : [ElasticStack] 유사도 스코어 BM25, TF IDF, score