나는 비슷한 질문이 여기에서 제기되었다는 것을 알고 있지만, 나는 그들 모두를 보았고 아무도 여전히 나를 만족시키지 못한다.HTML로 PDF를 변환하는 방법?
음, xpdf와 pdftohtml 모두 훌륭하지만 PDF의 새 버전이 작동하지 않는 것 같습니다.
내 문제는 모든 PDF 또는 문서를 HTML로 변환하고 스타일과 구조를 유지할 수있는 방법을 찾는 것입니다. 누군가가 무언가를 가지고 있다면, 심지어 완벽한 것을 지불해야합니다.
나는 비슷한 질문이 여기에서 제기되었다는 것을 알고 있지만, 나는 그들 모두를 보았고 아무도 여전히 나를 만족시키지 못한다.HTML로 PDF를 변환하는 방법?
음, xpdf와 pdftohtml 모두 훌륭하지만 PDF의 새 버전이 작동하지 않는 것 같습니다.
내 문제는 모든 PDF 또는 문서를 HTML로 변환하고 스타일과 구조를 유지할 수있는 방법을 찾는 것입니다. 누군가가 무언가를 가지고 있다면, 심지어 완벽한 것을 지불해야합니다.
음, 리눅스 전용 라이브러리를 사용해 보았습니다 만, 중간 결론입니다.
PDFtoHTML가 너무 오래되어 (xpdf를 그의 3 버전에서 이미있는 동안, 그것은의 xpdf 2.02를 사용 주로 때문이다) 예를 들어, PDF 1.7, 모든 새로운 PDF 사양을 고려하여 대신 내가 찾은 PDFTOHTML의
을지지 않습니다 Poppler PDFtoHTML 개발과 몇 가지 새로운 유틸리티가 매우 유용합니다. 실제로 Open Source에서 Poppler는 복잡한 PDF를 더 잘 표현한 사람이었습니다. Here 하나는 거의 같았습니다.
마지막으로 여기에 제가 사용하려고하는 내용이 있습니다. ImageMagick + Poppler. 내 PDF를 이미지로 변환하고 PDFtoPoll의 Poppler에서 XML 출력을 사용하여 이미지에 새 레이어를 추가합니다.
실제로 PDFfHTML은 xpdf 3에 기반하고 있습니다. Xpdf 버전 3.00을 기반으로 한 012ft16 버전의 pdftohtml 버전 0.36 http://pdftohtml.sourceforge.net/ Copyright 1999-2003 Gueorgui Ovtcharov and Rainer Dorsch Copyright 1996- 2004 Glyph & Cog, LLC –
'pdftohtml -c file.pdf file.htm'을 사용해 보셨습니까? –
나는 당신을 PDF에서 HTML 또는 더 나은 XHTML로 자동 변환 도구를 찾고 있었다. 글쎄, 그것은 단지 양면 이었지만, 결국 http://www.pdfonline.com (온라인 PDF To HTML)이 나에게 가장 좋은 일을했다. 문구뿐만 아니라 테이블 및 파라 글래스를 필터링하고 올바르게 표시 할 수도 있습니다.
아직도 내 일에는 충분하지 않아 수동으로 템플릿 파일을 생성했습니다.
이것이 pdf로 저장하는 지원이 있는지 기억하지만 그것이 있어야한다고 생각합니다. http://www.techsmith.com/snagit/ 확신 할 수있는 점은 전체 웹 사이트의 스크린 샷을 캡처하고 다양한 이미지 형식으로 저장할 수 있다는 것입니다. 텍스트가 텍스트로 보존되는 한, 나는 완전히 확신 할 수 없다. – Joonas
@Lollero, 그것은 내가 찾고있는 것이 아니거나 뭔가 오해했습니다. – yvan
나는 그것을 볼 수 있습니다 ._ 지금. 나는 제대로 읽지 못해서 미안하다. (일반적으로) 나는 그 두 가지를 잘 보존하고 있지만 Photoshop에서 웹용으로 저장할 수는 없다. 슬라이스 도구로 링크를 추가하고 저장할 수있다. html 문서 .. 그 모양을 100 % 보존하지만 기본적으로 하나의 이미지가 될 것입니다 .. 나는 당신이 당신의 출력을 큰 크기로 원한다면 추천하지 않을 것입니다. 더하기 당신은 여러 페이지가 있다면 .. PDF 문서의 수동 처리가 매우 빠르지 않다. – Joonas