2011-10-10 3 views
0

대시에 대한 모든 게시물을 읽었으며 거의 ​​모든 것을 시도했지만 아직 이상한 문제를 파악할 수 없습니다.검색시 문제가되는 저자 이름의 스핑크스

아르투로 페레스 레 베르테

'페레즈 - REVERTE'에 대한 검색 아무것도를 설정하지 않으며, '페레즈 - REVERTE은'그래서 탈출합니다

예를 들어,이 같은 저자의 이름이 돌진은 문제가되지 않습니다. 하지만 'spider-man'을 검색하면 조회수가 반환되어 대시가 작동하고있는 것으로 나타납니다. 그러나 'perez reverte'를 검색하면 각 단어를 별도로 검색하고 'perez-reverte'에서 'reverte'를 찾습니다 (그러나 'perez'는 찾지 못하는 것 같습니다).

'pérez'또는 'perez'를 검색하면 같은 수의 문서가 검색되므로 악센트가 문제가 아니라고 제안합니다 (악센트 부호가있는 문자를 설명하는 charset_table이 있음).

그래서 여기서 무슨 일이 일어나고 있는지 매우 혼란 스럽습니다. 악센트가 아니고 돌진이 아니라면 무엇이 될 수 있습니까?

ignore_chars 세트가 없으므로 UTF-8을 사용하고 charset_table을 사용하여 악센트 부호가있는 문자를 일반 문자로 처리합니다.

이 두 용어의 유일한 차이점은 그 중 하나가 제목 (스파이더 맨)이고 다른 하나는 작성자이지만 동일한 스핑크스 색인 선언의 일부이므로 모두 표시되지 않습니다. 어쨌든 문제.

도움을 주시면 감사하겠습니다.

sql_query_pre = SET NAMES utf8 
sql_query_pre = SET CHARACTER SET utf8 

을 한 후 :

답변

0

이 많이와 싸움 후, 나는 내 데이터베이스가 적절한 데이터 정렬 모든 UTF-8 인 경우에도 나는 모든 것이 제대로 작동하려면 sphinx.conf이를 추가 할 필요가 있다고 발견 그 일을하고, 적절한 charset_table을 가지고, 모든게 잘 작동하는 것 같습니다.

다른 사람에게 도움이되기를 바랍니다.