2011-08-19 8 views
1

나는 비슷한 질문이 여기에서 제기되었다는 것을 알고 있지만, 나는 그들 모두를 보았고 아무도 여전히 나를 만족시키지 못한다.HTML로 PDF를 변환하는 방법?

음, xpdf와 pdftohtml 모두 훌륭하지만 PDF의 새 버전이 작동하지 않는 것 같습니다.

내 문제는 모든 PDF 또는 문서를 HTML로 변환하고 스타일과 구조를 유지할 수있는 방법을 찾는 것입니다. 누군가가 무언가를 가지고 있다면, 심지어 완벽한 것을 지불해야합니다.

+0

이것이 pdf로 저장하는 지원이 있는지 기억하지만 그것이 있어야한다고 생각합니다. http://www.techsmith.com/snagit/ 확신 할 수있는 점은 전체 웹 사이트의 스크린 샷을 캡처하고 다양한 이미지 형식으로 저장할 수 있다는 것입니다. 텍스트가 텍스트로 보존되는 한, 나는 완전히 확신 할 수 없다. – Joonas

+0

@Lollero, 그것은 내가 찾고있는 것이 아니거나 뭔가 오해했습니다. – yvan

+0

나는 그것을 볼 수 있습니다 ._ 지금. 나는 제대로 읽지 못해서 미안하다. (일반적으로) 나는 그 두 가지를 잘 보존하고 있지만 Photoshop에서 웹용으로 저장할 수는 없다. 슬라이스 도구로 링크를 추가하고 저장할 수있다. html 문서 .. 그 모양을 100 % 보존하지만 기본적으로 하나의 이미지가 될 것입니다 .. 나는 당신이 당신의 출력을 큰 크기로 원한다면 추천하지 않을 것입니다. 더하기 당신은 여러 페이지가 있다면 .. PDF 문서의 수동 처리가 매우 빠르지 않다. – Joonas

답변

1

음, 리눅스 전용 라이브러리를 사용해 보았습니다 만, 중간 결론입니다.

PDFtoHTML가 너무 오래되어 (xpdf를 그의 3 버전에서 이미있는 동안, 그것은의 xpdf 2.02를 사용 주로 때문이다) 예를 들어, PDF 1.7, 모든 새로운 PDF 사양을 고려하여 대신 내가 찾은 PDFTOHTML의

을지지 않습니다 Poppler PDFtoHTML 개발과 몇 가지 새로운 유틸리티가 매우 유용합니다. 실제로 Open Source에서 Poppler는 복잡한 PDF를 더 잘 표현한 사람이었습니다. Here 하나는 거의 같았습니다.

마지막으로 여기에 제가 사용하려고하는 내용이 있습니다. ImageMagick + Poppler. 내 PDF를 이미지로 변환하고 PDFtoPoll의 Poppler에서 XML 출력을 사용하여 이미지에 새 레이어를 추가합니다.

+0

실제로 PDFfHTML은 xpdf 3에 기반하고 있습니다. Xpdf 버전 3.00을 기반으로 한 012ft16 버전의 pdftohtml 버전 0.36 http://pdftohtml.sourceforge.net/ Copyright 1999-2003 Gueorgui Ovtcharov and Rainer Dorsch Copyright 1996- 2004 Glyph & Cog, LLC –

+0

'pdftohtml -c file.pdf file.htm'을 사용해 보셨습니까? –

1

나는 당신을 PDF에서 HTML 또는 더 나은 XHTML로 자동 변환 도구를 찾고 있었다. 글쎄, 그것은 단지 양면 이었지만, 결국 http://www.pdfonline.com (온라인 PDF To HTML)이 나에게 가장 좋은 일을했다. 문구뿐만 아니라 테이블 및 파라 글래스를 필터링하고 올바르게 표시 할 수도 있습니다.

아직도 내 일에는 충분하지 않아 수동으로 템플릿 파일을 생성했습니다.

관련 문제