OpenSearchServer (커뮤니티 에디션) v1.2.4-rc3 - stable - rev 1474 - 빌드 802입니다. C# 및 C++ 프로그래밍 웹 사이트를 크롤링합니다. 이제 C# 또는 C++를 검색하면 #, + 같은 특수 문자가 제거됩니다. 소프트웨어가 반환하는 결과는 정확하지 않습니다. OpenSearchServer/Lucene에서 (#)과 같은 특수 문자는 어떻게 처리합니까? 어느 누구도 저에게 아이디어를 제안 할 수 있습니까? 미리 감사드립니다.OpenSearchServer/Lucene에서 (#)과 같은 특수 문자는 어떻게 처리합니까?
1
A
답변
1
C# 및 C++ 코드 용어를 나타내는 데 필요한 특수 문자를 보존하는 사용자 지정 또는 준 사용자 지정 토큰izer를 사용하도록 인덱싱 전략을 변경해야합니다. 인덱싱 및 검색 중에이 토큰 화 도구를 사용합니다.
오프 손, 나는 (토크 나이를 사용 (토크 나이를 구성하는 방법과 같은 몇 가지 아이디어를 얻을 수 org.apache.lucene.analysis.standard 및 org.apache.lucene.wikipedia.analysis 볼 것 어휘 분석기) JFlex와 같은 generator는 tokenizer를 직접 코딩하지 않고 호출 될 수 있습니다.
관련 문제
- 1. PHP는 MySQL의 특수 문자는
- 2. 특수 지역의 문자는 사방
- 3. 이러한 특수 문자는 Perl에서 어떻게 작동합니까?
- 4. 특수 문자는 문자열
- 5. 특수 문자는 MySQL이
- 6. 삽입 특수 문자는
- 7. WCF REST 게시 방법의 특수 문자는 무엇입니까?
- 8. 특수 문자가있는 쿼리에 사용되는 값은 어떻게 처리합니까?
- 9. jquery에서 특수 문자를 어떻게 이스케이프 처리합니까?
- 10. Perl 정규 표현식에서 특수 문자를 어떻게 처리합니까?
- 11. 출력의 특수 문자는 다음과 같습니다.
- 12. 특수 문자는? 내 mysql 데이터베이스에서
- 13. 표시와 같은 스페인어 특수 문자는 뒤죽박죽 또는 쓰레기 값을 표시합니다.
- 14. 웹 스크래핑 중 지원되지 않는 문자는 어떻게 처리합니까?
- 15. Amazon S3 키의 특수 문자는 무엇입니까?
- 16. 저장하고 검색 할 특수 문자는 MySQL의
- 17. Java에서 이러한 특수 문자는 무엇을 의미합니까?
- 18. HTML로 인코딩 된 특수 문자는 세미콜론으로 끝나야합니까?
- 19. Nabla 특수 문자는 Null 문자로 표시됩니다.
- 20. 같은 이름의 자식 노드를 어떻게 처리합니까?
- 21. VisualStudio에서 같은 이름의 여러 파일을 어떻게 처리합니까?
- 22. & nbsp;과 같은 특수 엔티티 처리, & gt; in HtmlCleaner
- 23. PHP는 정규식에 [: alnum :]과 같은 특수 문자 클래스를 사용합니까?
- 24. MATLAB에서 '(', '/', ''와 같은 특수 문자를 비교하는 방법
- 25. 일부 특수 문자가 포함 된 URL을 어떻게 처리합니까?
- 26. 스핑크스는 URL을 어떻게 처리합니까?
- 27. Jackson JSON이 특수 문자를 이스케이프 처리합니까?
- 28. 제한된 수의 문자는 어떻게 인쇄합니까?
- 29. 제거 보이지 않는 문자는
- 30. 국제 문자는