반응형

Algorithm 2

k-NN 알고리즘 요약

K-Nearest Neighbors (K-NN) 알고리즘이란?K-Nearest Neighbors, 줄여서 K-NN 알고리즘은 **지도 학습(Supervised Learning)**의 대표적인 알고리즘 중 하나입니다. 특정 데이터 포인트가 주어졌을 때, 해당 데이터와 가장 가까운 K개의 이웃을 찾고, 이들의 특성을 기반으로 분류(Classification)하거나 예측(Regression)하는 데 활용됩니다. K-NN은 단순하지만 강력한 성능을 제공하며, 이해하기 쉬운 알고리즘으로 초보자부터 전문가까지 널리 사용되고 있습니다.K-NN의 주요 개념K-NN은 새로운 데이터 포인트가 들어오면 **거리(Distance)**를 기반으로 가장 가까운 이웃을 찾습니다. 여기서 사용하는 거리 척도는 보통 **유클리드 거리..

Algorithm 2024.10.23

BM25 알고리즘 요약

BM25란 무엇인가?BM25는 "Best Matching 25"의 약자로, 문서와 검색 쿼리 간의 관련성을 점수로 나타내는 방법입다. 검색 엔진이 사용자에게 가장 적합한 정보를 제공하기 위해 이 알고리즘을 사용하죠. BM25는 여러 요소를 조합하여 문서의 점수를 계산합니다.BM25의 주요 요소1. 단어 빈도 (TF)단어 빈도는 특정 문서에서 쿼리와 관련된 단어가 얼마나 자주 등장하는지를 나타냅니다. 예를 들어, "강아지"라는 단어가 문서에 많이 포함되어 있다면, 이 문서는 "강아지"에 대한 쿼리와 관련성이 높다고 판단합니다. 간단히 말해, 같은 단어가 많이 나오면 그만큼 중요하다고 보는 것이죠!2. 역문서 빈도 (IDF)역문서 빈도는 특정 단어가 전체 문서 집합에서 얼마나 드물게 등장하는지를 평가합니다...

Algorithm 2024.10.23
반응형