2012-01-27 8 views
0

가능한 복제를 PDF로 :
How do I grab a thumbnail screenshot of many websites?기계화 인쇄는

나는 펄 로그인하고 페이지를 가져 오지 기계화 사용하여 스크립트를 썼다. 내 펄 스크립트에서 직접 "pdf"로 그 페이지를 "인쇄"할 수 있습니까? 브라우저에서 어떻게 보이는지 스냅 샷을 저장하고 싶습니다. 당신은 단지 그것을 인쇄 할 수 있도록

은 내가 $mech 일반 HTML을 포함 $mech->content();

+0

내 대답은 [텍스트의 각 단어에 대한 이미지 생성을위한 제안] (http://stackoverflow.com/a/7820994/46395)을 참조하십시오. PDF 출력이 지원되며 거대한 임베디드 비트 맵 스크린 샷뿐만 아니라 선택 가능한 텍스트 및 내용을 포함하는 * 실제 * PDF가됩니다. 이 모듈에는 아직 Mechanize 호환 프론트 엔드가 없지만 [이전 버전에는 하나가 있기 때문에] 쓰기가 어렵지 않습니다 (http://p3rl.org/Gtk2::WebKit::Mechanize). – daxim

답변

2

체크 아웃 wkhtmltopdf - PDF 및 이미지 (PNG 등)의 변형이 있습니다. 이것은 기본적으로 webkit html 엔진을 래핑하는 명령 줄 도구입니다. 꽤 잘 작동하고, 크로스 플랫폼이기도합니다. 로그인 양식을 초과 할 수 있는지 여부는 대상 사이트의 작동 방식에 따라 다릅니다.

+0

이것은 Mechanize와 통합되지 않습니다. – daxim

+0

@ daxim "통합"이란 무엇을 의미합니까? 당신은 Mechanize에서 HTML을 가져 와서 wkhtmltopdf로 넘깁니다. – Schwern