2012-09-17 6 views
2

따라서 asciifoldingèe으로 바뀌지 만 `과 같은 하나의 악센트는 필터링하지 않습니다. 맞습니까? 그럼 내가 어떻게 그들을 없앨 수 있니? 예를 들어 O`Learys의 색인을 생성하고 olearys, O learys, o`learys의 변형을 검색 할 수 있습니다.탄성 검색, 액센트 필터

+0

WordDelimiterFilterFactory에 대한 작업이어야합니다. 체크 아웃하십시오. – javanna

+0

나는 [that] (http://www.elasticsearch.org/guide/reference/index-modules/analysis/word-delimiter-tokenfilter.html)을 보았지만, 그것을'''o '''''''''''''''''''''''''''''과 일치하지 않으므로? – Yeggeps

+0

좋아요, WordDelimiter를 시도했지만 예상했던대로'''olearys''와 일치하지 않지만'''learys''' 및'''learys''와 일치합니다. – Yeggeps

답변

3

가 나는 O`Learys이 분석기, tokenizers 또는 elasticsearch와 함께 필터를 사용하여 동시에 olearysO learys 모두 일치 할 수 있도록 가능하다고 생각하지 않습니다. `의 존재를 감지하고 O`Learys을 두 번 색인화해야합니다. 첫 번째 토큰은 olearys이고 두 개의 토큰은 olearys입니다. 그것은 사용자 정의 토큰 필터로만 작성하여 수행 할 수 있습니다.

는 해결 방법으로 모두 olearyso`learysMapping Char Filter를 사용하여 입력에서 문자 `를 제거하여 O`Learys에 맞게 만들 수 있습니다.

+0

감사! 잘 작동했다면 이미 분석기에 n-gram 필터가 있었기 때문에 사실'''learys''와 일치했습니다. – Yeggeps