2011-08-25 5 views
4

solrj 1.4를 사용하고 있습니다. 내 solrj는 utf-16 인코딩으로 문서를 올바르게 색인화하지 않습니다. 유니 코드로 변환하려고 시도 할 때 문제가있는 utf-16 대리 키를 유니 코드 대체 가능 문자 U + FFFD로 바꿉니다. 아무도 나에게 utf-8뿐만 아니라 utf-16 문서의 색인/검색을 위해 solrj 1.4를 구성하는 방법을 안내해 줄 수 있습니까?Solr 대 문서 인코딩 문제

답변

1

Solr 색인은 utf-8 (Why don't International Characters Work)입니다. 다른 인코딩을 사용하여 검색 할 수 있으려면 Solr을 인터페이싱하는 소프트웨어에서 항상 번역을 수행 할 수 있습니다.

+0

utf-16에서 utf-8 로의 변환은 항상 100 % 성공합니다. 어떤 바보 증명 방법이나 api를 사용할 수 있습니까? – user911084

+0

모름지 모르겠지만 [CharsetEncoder] (http://download.oracle.com/javase/6/docs/api/java/nio/charset/CharsetEncoder.html)는 일반적으로 편리합니다. –