2011-08-01 5 views
3

Solosh의 Whoosh에서 내 검색 앱을 다시 실행하고 있습니다. 나는 지금 빠른 시작에서 배우고있다. 하지만 문제가 내가 문자열whoosh는 모든 문자열을 유니 코드로 요구합니까?

>>>writer.add_document(iden=fil, content=F2T.file_to_text(fil_path)) ValueError: 'File Name.doc' is not unicode or sequence

다음

및 처리했다 때마다 실행 유지 :

>>>query = QueryParser("content", ix.schema).parse("first") 
AssertionError: 'first' is not unicode 

을 그리고 그 라인은 빠른 시작 turorial에서 바로 온다! Whoosh는 모든 필드가 유니 코드 일 것을 요구합니까? 내 앱을 유니 코드 인식 (그리고 그럴 가치가 없다)하게 만드는 것은 정말 어려운 작업입니다. "유니 코드 또는 시퀀스가 ​​아닙니다"에 관해서는 문자열이 시퀀스 데이터 형식이라는 것을 알고 있습니다.

+0

가 왜 붕의 메일 링리스트 또는 포럼에 요구하지 않습니다에 있음을

query = QueryParser("content", ix.schema).parse("first") 

변경? –

+0

흠이 Whoosh 쿼리를위한 최선의 선택입니까? – aitchnyu

+0

특정 소프트웨어에 대해 질문이있는 경우, 일반적인 프로그래밍 Q & A 웹 사이트에 게시하는 대신, 알고있는 사람들에게 질문하여 대답을 얻으실 수 있습니다. –

답변

8

네, 문자열이 유니 코드이어야합니다.

query = QueryParser("content", ix.schema).parse(u"first") 
관련 문제