2016-06-04 3 views
1

나는 레스토랑 추천 시스템을 구축 중이다. 각 레스토랑은 문서의 형태로 표현됩니다. 그것은 다음과 같은 특징 (분야), 요리, 시설, 유형이 있습니다.Lucene, 더 많은 것에 대한 대안이?

이제 MoreLikeThis Query에 대해 읽었습니다. 용어 빈도를 기반으로 유사한 문서를 찾습니다. 그래서, 예를 들어 무시, 다음 요리

두 문서 "스테이크 하우스 호주 글루텐"

때문에, 루씬 지수는 한 번만 발생하기 때문에, 그들에게 중요한 측면을 고려 doesnot.

용어 빈도를 무시하는 다른 쿼리가 있습니까? 가장 많은 수의 키워드를 기반으로 유사한 문서를 찾습니다.

당신은 QueryParser를 통해 실행하여, 문서의 전체 내용 쿼리를 만들 수

답변

0

, 같은 : 성능 저하의 원인이

QueryParser myQueryParser = new QueryParser(myFieldName, new StandardAnalyzer()); 
Query query = myQueryParser.parse(QueryParserBase.escape(myDoc.get(myFieldName))); 

잠재적 인 문제가 될 것이다 너무 긴 쿼리 (즉,에 이유 MoreLikeThis 시도이다 모두를 검색하는 대신 쿼리 할 최적의 용어를 선택하십시오.) 또는 너무 많은 절 예외.

관련 문제