2010-05-30 5 views

답변

1

누군가가 루씬에 아랍어와 페르시아어 지원을 얻는 방법 2.4

그래서 이러한 비공식적으로 여기에 백 포트되기 전에 나에게 물었다 : http://people.apache.org/~rmuir/

http://people.apache.org/~rmuir/lucene-analyzers-2.4.1_with_arabic_and_farsi.jar http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch

이 만에이 의미 2.4.1로 업그레이드하십시오. 2.9 또는 3.0으로 업그레이드하는 것보다 쉬울 수도 있습니다.

희망이

1

루씬의 3.0.1 Arabic Analyzer있다. contrib package에 있습니다.

Lucene 3.0.1로 업그레이드하면이 항목을 즉시 사용할 수 있습니다. 이 릴리스에서는 TokenStream API가 변경되었으므로 Lucene 2.2의 경우와 같이이 기능을 사용할 수 없습니다. 그러나 최신 Lucene 릴리스로 마이그레이션하지 않으려는 경우에 대비하여 2.2 로의 이전 포팅 변경은 매우 어렵지 않습니다.

+0

난 그냥 루씬 2.2 아랍어 분석기를 추가하고 최신 버전으로 업그레이드하지 생각하는 이유는 내가이 RuntimeException을 던졌습니다 모든 사용되지 않는 방법을 대체해야한다는 것입니다 도움이되지만 결국 내가 추측 Lucene의 새로운 기능이 출시 될 때마다 내 항아리를 만들고 싶지 않기 때문에 유지 보수상의 이유로 최신 버전으로 마이그레이션 할 것입니다. –

0

또는 lucene-hunspell을 분석기로 사용해 볼 수 있습니다. 현재 Lucene 트렁크와 함께 작동 중입니다. Lucene 3.0.1에서 작동하는지 여부는 알 수 없습니다. 여기에 Robert Muir's explanationa list of dictionaries, including Arabic입니다. 나는 당신이 또한 이것을 뒤집을 수 있다고 믿습니다. Shashikant의 제안은 구현하기가 더 쉬운 것처럼 보이지만, 이것은 더 나은 품질 일 수 있습니다.