1

검색 결과를 최종 사용자에게 더욱 유용하게 만드는 데는 문제가 있습니다. 문제는 오히려 정확한 기술이나 프레임 워크를 사용하는 알고리즘과 접근법과 관련이 있습니다. 다음 스키마를 설명 할 수 있습니다 우리는 제품의 데이터베이스가 순간 검색 결과의 관련성 증가

: 검색의 관점에서

http://goo.gl/391qj

우리 꽤 표준 것들과 3 번째 파티 텍스트 검색을 수행 한 토큰 분석기, 실수 유형 및 동의어 처리 (전체 목록은 아니지만, 내가 말했듯이 범위를 벗어났습니다). 그러나 검색 결과를 실제 사용자의 요구에 더 가깝게 만들기 위해 추가 작업을 수행해야합니다. Google은 관련성에 따라 색인 된 페이지의 순위를 매기는 방식과 비슷합니다.

  • 가와에서 해당 항목에 대한 순위를 증가 (여전히 그들을 얻을하는 방법 질문입니다) 광범위한 검색 엔진에서 가장 인기있는 검색 요청을 분석 : 아이디어는, 그 we`ve 이미 문제를 해결 잠재적 적용으로 간주 인기있는 요청에 해당하는 (찾을 수있는) 색인.
  • 최신 (인기있는) 항목의 순위를 올립니다.
  • 인기있는 요청에 해당하는 가장 큰 항목 그룹의 순위를 높이고 공통점이 있습니다 (즉, 그룹 인 이유입니다).

어떤 도움을 주거나 방향을 조언하고, 어디서 파는 지 잘 알고 있습니다.

답변

1

pLSA를 시도해 볼 수 있습니다. 웹에 많은 참고 자료가 있으며 도서관과 소스 코드가 있어야합니다.

편집 :

잘, 나는 최근 루씬에 대해 자세히 살펴했다, (이 필리핀 선박 회사 연합 (PLSA)를 사용하지 않는) 문제가 실제로 무엇을 요구에 훨씬 더 나은 대답을 줄 것으로 보인다. db와의 통합에 관해서는, 당신은 Hibernate Search를 사용할 수있다. (Lucene 지시어를 사용하는 것만 큼 강력하지는 않지만).

+0

감사합니다. 지금 적용 해 보겠습니다. –

관련 문제