웹 페이지의 가장 가까운 k 이웃을 식별하는 라이브러리 또는 알고리즘 (코드를 직접 작성하므로)을 찾고 싶습니다. 여기서 웹 페이지는 키워드 집합으로 정의됩니다. 나는 이미 키워드를 추출한 부분을 수행했다.키워드 기반의 가장 가까운 이웃 알고리즘 또는 라이브러리
매우 좋을 필요는 없습니다. 단지 충분합니다.
누구나 솔루션을 제안하거나 시작할 장소를 제안 할 수 있습니까? 나는 Yury Lifshits의 강연을 과거에 들여다 보았지만 가능한 한 기성품을 얻기를 희망한다.
Java 라이브러리가 선호됩니다.
위치를 매핑 하시겠습니까? 아니면 키워드를 기반으로 다른 페이지와 관련된 알고리즘을 원하십니까? – fasseg
당신은 웹 사이트 노드의 가중치없는 무향 그래프를 만들 수 있고, 가장자리의 가중치는 "근접성"을 나타낼 수 있습니다. 예 : 2 개의 위치가 공유지에서 가지고있는 각 키워드는 그들의 가장자리 weigth에있는 증가 일 수 있었다. 당신이 사용할 수있는 자바 그래프 라이브러리가 많이 있습니다. – fasseg
@smegbrains, 네, 그렇게 생각합니다. 나는 두 키워드의 교차를 계산했다. (너는 '너비'라고 부르는 것에 해당한다.) – Ankur