HTML을 docx 또는 RTF으로 변환하고 싶습니다. docx와 RTF 문서를 생성하기위한 Ruby 젬이 많이 있습니다 만, 을 작성하면 빈 문서가 작성되고 프로그래밍 방식으로 추가 할 수 있습니다.HTML을 문서 양식으로 변환하려면 어떻게해야합니까?
이러한 보석의 문제점은 인쇄 가능한 페이지에서 웹 페이지의 형식을 동일하거나 유사하게 정확하게 변환 할 수 없다는 것입니다. HTML 태그에는 많은 복잡성과 CSS 속성으로 인한 태그의 위치가 있습니다. 거기 RTF 및 Word 생성을위한 보석의 내 현재의 지식으로
, 나는 HTML 파서를 작성하고 굵게, 기울임, 그러나 위치 것들과 비슷한 OPENXML 태그에 모든 HTML 태그를 변환해야 할 것 CSS를 기반으로하지만, position: relative/absolute
로 인해 문서 페이지를 렌더링하는 것은 매우 어려울 것입니다.
최근에 개발 된 것이 있는지 또는 곧 출시 될 보석이나 서비스 또는이 변환을 처리 할 수있는 도구가 있는지 궁금합니다.
Word를 HTML과 변환하는 것으로 알려져 있지만 설명서가 없으므로 보석은 https://www.ruby-toolbox.com/gems/word_parsing 및 rubygems에서만 찾을 수 있습니다. 그리고 종속성 문제로 인해 로컬 컴퓨터에 설치하는 데 실패했습니다. 문서가 없기 때문에 종속성을 수정하는 방법은 언급되어 있지 않습니다.
PDF를 "단어"로 변환하고 HTML을 PDF로 변환하는 서비스는 이미 여러 사람이나 보석으로 해결되었습니다. 이 서비스는 http://www.pdftoword.com/으로 PDF를 RTF로 변환하고 결과 문서의 이미지를 구분합니다. 그들의 문제는 Windows 서버에서 실행된다는 것입니다. 제가하고있는 응용 프로그램은 Unix 기반 서버에서 실행되는 Ruby on Rails이기 때문에 크로스 플랫폼이 필요합니다.
OpenOffice/LibreOffice의'--headless --convert-to' 기능을 고려해 보셨습니까? 대답으로 게시하지 않을 것입니다, 나는 그것이 작동하는 것을 들었을 뿐이므로 결코 그것을 사용하지 마십시오. – Charles
나는 가지고 있지 않거나 보석 형태로 가질 수 있습니까? – NullVoxPopuli
나는 OOo/LO 인 거대한 바이너리 horribleness를 모두 포함 할 수있는 보석을 만드는 것이 개념적으로 가능하다고 생각하지만, 그것은 어리석은 짓이다.환경을 제어 할 수 있다면 적절한 패키지가 설치되어 있고 롤아웃 중에 바이너리가 예상되는 위치에 있는지 간단히 확인할 수 있습니다. * 환경을 제어하지 않으면 * 아마 비 스타터 일 것입니다. 나는 그들의 시스템에 OOo/LO를 설치하도록 요청할 때 시스템 관리자들로부터 긍정적 인 반응을 기대하지 않을 것이다. – Charles