은 가능한 아랍어 분석기를 추가 루씬 2.2을 수정하는 것입니다 내가 소스/항아리를 얻을 수있는 사람이 이미이 작업을 수행 한 경우루씬 2.2 아랍어 분석기
답변
누군가가 루씬에 아랍어와 페르시아어 지원을 얻는 방법 2.4
그래서 이러한 비공식적으로 여기에 백 포트되기 전에 나에게 물었다 : http://people.apache.org/~rmuir/
http://people.apache.org/~rmuir/lucene-analyzers-2.4.1_with_arabic_and_farsi.jar http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch
이 만에이 의미 2.4.1로 업그레이드하십시오. 2.9 또는 3.0으로 업그레이드하는 것보다 쉬울 수도 있습니다.
희망이
루씬의 3.0.1 Arabic Analyzer있다. contrib package에 있습니다.
Lucene 3.0.1로 업그레이드하면이 항목을 즉시 사용할 수 있습니다. 이 릴리스에서는 TokenStream API가 변경되었으므로 Lucene 2.2의 경우와 같이이 기능을 사용할 수 없습니다. 그러나 최신 Lucene 릴리스로 마이그레이션하지 않으려는 경우에 대비하여 2.2 로의 이전 포팅 변경은 매우 어렵지 않습니다.
또는 lucene-hunspell을 분석기로 사용해 볼 수 있습니다. 현재 Lucene 트렁크와 함께 작동 중입니다. Lucene 3.0.1에서 작동하는지 여부는 알 수 없습니다. 여기에 Robert Muir's explanation과 a list of dictionaries, including Arabic입니다. 나는 당신이 또한 이것을 뒤집을 수 있다고 믿습니다. Shashikant의 제안은 구현하기가 더 쉬운 것처럼 보이지만, 이것은 더 나은 품질 일 수 있습니다.
- 1. 루씬
- 2. 어떻게 안드로이드 2.2 에뮬레이터에 대한 아랍어 구성을 설정
- 3. 루씬 DistanceQueryBuilder
- 4. 루씬 동작은
- 5. 루씬 쿼리는
- 6. 심포니와 루씬
- 7. 어떻게 루씬
- 8. Lucene 쿼리 및 분석기 조합
- 9. 는 Field.Store.COMPRESS는 루씬 3.0.2
- 10. 루씬 MoreLikeThis는 유형
- 11. 루씬 쿼리 문자열
- 12. 젠드 루씬 - 범위
- 13. 루씬 상관없이 검색어 여기
- 14. 루씬 지수 특수 문자가
- 15. Linq에 루씬 오류로 :
- 16. 자바 루씬 클래스가 문제
- 17. 정밀도 문제와 루씬
- 18. (HibernateSearch) 필드마다 다른 분석기 MultiFieldQueryParser 다른 분석기
- 19. 키워드 분석기
- 20. 티파니 분석기
- 21. 문제 내 키워드 밀도 분석기
- 22. 누가 루씬 BooleanQuery 누가 복음에서
- 23. 루씬 검색 키워드 색인 필드
- 24. 루씬 문서 점수는 후 검색
- 25. 루씬 쿼리의 임기 문서 루씬과
- 26. HTML 아랍어 텍스트
- 27. Android 태블릿 아랍어 지원
- 28. 자바 아랍어 (Hirji) 캘린더
- 29. 아랍어 사전 데이터베이스를 찾고
- 30. 아랍어 스타일의 쓰기 구현
난 그냥 루씬 2.2 아랍어 분석기를 추가하고 최신 버전으로 업그레이드하지 생각하는 이유는 내가이 RuntimeException을 던졌습니다 모든 사용되지 않는 방법을 대체해야한다는 것입니다 도움이되지만 결국 내가 추측 Lucene의 새로운 기능이 출시 될 때마다 내 항아리를 만들고 싶지 않기 때문에 유지 보수상의 이유로 최신 버전으로 마이그레이션 할 것입니다. –