pdf2htmlEX을 사용하여 여러 개의 html 파일로 PDF를 분할

PDF 파일을 별도의 HTML 파일로 분할하려고합니다. HTML 파일이 필요한 각 PDF 페이지를 의미합니다. 이것은 내가 그것을 할 방법은 다음과 같습니다 lms%031.html, lms%032.html : 결과에서pdf2htmlEX을 사용하여 여러 개의 html 파일로 PDF를 분할

pdf2htmlEX --split-pages 1 LMS.pdf --page-filename lms%03.html

내가 빈 LMS.html 및 기타 파일을 얻었다. 문제는 그 html 파일이 CSS 스타일이 올바르게 포맷되어 있지 않다는 것입니다.

출처

2014-10-14 HamidIng

재미있는 점은 ... 동일한 문제를 해결하는 동안 나는 당신의 질문을 우연히 발견했습니다. --page-filename 매개 변수를 설정하지 않은 경우를 제외하고 나는 당신과 같은 명령을 사용했습니다.

pdf2htmlEX --split-pages 1 LMS.pdf

가 그럼 난 빈 페이지의 무리를 찾기 위해 크롬의 주요 HTML 파일을 열어 : 귀하의 예제를 사용하여, 내 pdf2htmlEX 호출은 유사 할 것이다. 약간 검색 한 후 Firefox에서 동일한 파일을 열었습니다. 그것은 효과가 있었다. 아주 이상한. 콘솔 출력에 오류가보고되지 않았습니다. 물론, 나는 크롬 콘솔 출력을 들여다 보지도 않았다. 내가 찾았을 때 :

Uncaught NetworkError: Failed to execute 'send' on 'XMLHttpRequest': Failed to load 'file:///...'.

하나님 감사합니다 StackOverflow. Firefox에서 작동하는 이유는 모르지만 Chrome에서보고 한 오류가 발생하는 경우 웹 서버를 실행해야합니다. 기본적으로

python -m SimpleHTTPServer

이 페이지가 http://localhost:8000에서까지 제공됩니다

내가이 작업을 수행하기위한 가장 쉽고 빠른 방법은 내가 PDF로 변환하고 실행하는 디렉토리로 변경했다. 문제 해결됨. 가장 적합한 서버를 사용하십시오.

출처

2015-01-08 19:23:41

이것은 동일한 출처 정책의 구현의 차이 때문입니다. 다운로드 한 HTML 파일의 경우 Chrome은 외부 파일 액세스를 허용하지 않지만 Firefox는 해당 디렉토리 내에서 액세스를 허용합니다. 웹 서버를 통한 동일한 출처 정책은 훨씬 더 합리적인 도메인 이름을 사용합니다. –

pdf2htmlEX을 사용하여 여러 개의 html 파일로 PDF를 분할

답변

관련 문제