2011-06-10 5 views

답변

3

당신이 인덱스에 필요한 다른 문서 형식이있는 경우, 그들은 단지 (참조 : Support of CHM Format) 최근 CHM 파서를 추가 Apache Tika

에서 더 일반적인 해결책을 찾을 수 있으며이 될 것이다 다음 버전.

+0

감사합니다. 나는 볼 것이다 :) –

3

Microsoft Compiled HTML Help 파일에 관해서는 JChm으로 텍스트를 추출한 다음 정상적인 방법으로 색인을 생성 할 수 있습니다.

+0

thnx. 나는 모양을 가질 것이다. :) –

+0

조심하십시오. 바이너리와 텍스트 (.hml로 저장된 .xml) 색인이있을 수 있으며, 동일한 내용을 포함하지 않을 수도 있습니다. –

+0

ChmParser amd를 사용하여 검색 파일을 사용하고 몇 가지 대안을 제시했습니다. 그것은 잘 작동하는 것, 그리고 .hhc 문제가 해결되었습니다. Thnx again –

관련 문제