나는 다음과 같은 필터 체인 루씬을 사용하고 있습니다 :Lucene에서 알 수없는 문자를 정규화하는 방법은 무엇입니까?
StandardFilter > LowerCaseFilter > GermanNormalizationFilter > ASCIIFoldingFilter
추가로 어떤 필터 나는 라틴 알파벳에 알 수없는 문자를 변환하는 데 사용할해야합니까? 예 : 러시아어 문자열은 Кадашевская
과 비슷합니다. 라틴 알파벳으로 변환하거나 제거해야합니다.
이 목적에 맞는 필터는 무엇입니까? 나는 ICUTransformFilter
좋은 선택이 될 것입니다 생각 ???????????