Suggester와 함께 Shingle Fitler를 사용하여 자동 제안 드롭 다운을 구현했습니다. 싱글 필터와 함께 사용하는 필드에는 preserveoriginal = 1 인 worddelimiter가있어 "women 's"를 "women 's"및 "womens"로 토큰 화합니다.동일한 시작과 끝을 가진 토큰을 무시하도록 ShingleFilterFactory 구성
왜냐하면 shingle 필터가 예상되는 토큰과 별도로 단어 ngram을 생성 할 때 "여성용 여성"토큰이 있습니다. ShingleFilter를 구성하여 동일한 시작 및 끝 값을 갖는 토큰을 무시할 수있는 방법이 있는지 알고 싶었습니다.
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.RemoveDuplicatesTokenFilterFactory
보다도 내가 널 필터 토큰 위치와 N- 그램이에 따라 고려할 것이라고 생각했다. 예를 들어 위치에 따르면, "빨간색 여성", "빨간색 여성", "여성 신발", "여성 신발"과 같은 토큰을 생성해야합니다. 하지만 그냥 직접 확인해 보았습니다. 그렇다면 다음과 이전 토큰을 어떤 기준에서 고려해야할까요? – rounak