2011-08-15 9 views
1

내 solr에서 아랍어 검색을 구현하고 싶습니다. 문서를 색인 할 수는 있지만 검색 할 수는 없습니다. 내가 ID로 문서를 참조하십시오 때 나는 문서를 얻을 수 있지만 아랍어 단어로 검색,Solr 아랍어 검색

검색 URL을 할 때

http://122.166.9.144:8080/solr/tw/select/?q=تأجير الاهلي 

검색 응답

<response> 
<lst name="responseHeader"> 
    <int name="status">0</int> 
    <int name="QTime">18</int> 
    <lst name="params"> 
     <str name="q">تأجÙر اÙاÙÙÙ</str> 
    </lst> 
</lst> 
<result name="response" numFound="0" start="0"/> 
</response> 

무엇이 문제 일 수 있습니까?

감사합니다,

Rohit는

편집 요청/응답 헤더

Response Headers view source 
Server Apache-Coyote/1.1 
Content-Type application/xml;charset=UTF-8 
Transfer-Encoding chunked 
Date Mon, 15 Aug 2011 15:37:25 GMT 

Request Headers view source 
Host 122.166.9.144:8080 
User-Agent Mozilla/5.0 (Windows NT 6.0; rv:5.0) Gecko/20100101 Firefox/5.0 
Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 
Accept-Language en-us,en;q=0.5 
Accept-Encoding gzip, deflate 
Accept-Charset ISO-8859-1,utf-8;q=0.7,*;q=0.7 
Connection keep-alive 
+0

좋은 점, 고맙습니다. – Tarek

답변

1

은 분명히 서버는 바로 캐릭터 세트를 사용하여 URL에서 아랍어 텍스트를 해독하는 데 실패합니다. 그것이 UTF-8을 가지고있는 것처럼 막연하게 보이지만 라틴어 -1이라고 생각했습니다. 대화에 wiresharking을 시도하여 정확히 어떤 URL 바이트가 서버로 전송되는지 확인 했습니까?

+0

요청/응답 헤더를 업데이트했습니다. q가 잘 진행되고있는 것 같습니다. – sesmic

+0

표시되는 내용은 네트워크 구문이 아니며 네트워크에서 전송 된 _ (요청에 따라 인코딩 된) 요청 URL을 포함하지 않습니다 _. –

+0

제안 사항에 대해 감사드립니다. 실제로 인코딩은 제 경우 서버 레벨 (tomcat)에서 올바르게 설정되지 않았습니다. – sesmic