2012-02-07 2 views
1

HTML을 docx 또는 RTF으로 변환하고 싶습니다. docx와 RTF 문서를 생성하기위한 Ruby 젬이 많이 있습니다 만, 을 작성하면 빈 문서가 작성되고 프로그래밍 방식으로 추가 할 수 있습니다.HTML을 문서 양식으로 변환하려면 어떻게해야합니까?

이러한 보석의 문제점은 인쇄 가능한 페이지에서 웹 페이지의 형식을 동일하거나 유사하게 정확하게 변환 할 수 없다는 것입니다. HTML 태그에는 많은 복잡성과 CSS 속성으로 인한 태그의 위치가 있습니다. 거기 RTFWord 생성을위한 보석의 내 현재의 지식으로

, 나는 HTML 파서를 작성하고 굵게, 기울임, 그러나 위치 것들과 비슷한 OPENXML 태그에 모든 HTML 태그를 변환해야 할 것 CSS를 기반으로하지만, position: relative/absolute로 인해 문서 페이지를 렌더링하는 것은 매우 어려울 것입니다.

최근에 개발 된 것이 있는지 또는 곧 출시 될 보석이나 서비스 또는이 변환을 처리 할 수있는 도구가 있는지 궁금합니다.

Word를 HTML과 변환하는 것으로 알려져 있지만 설명서가 없으므로 보석은 https://www.ruby-toolbox.com/gems/word_parsing 및 rubygems에서만 찾을 수 있습니다. 그리고 종속성 문제로 인해 로컬 컴퓨터에 설치하는 데 실패했습니다. 문서가 없기 때문에 종속성을 수정하는 방법은 언급되어 있지 않습니다.

PDF를 "단어"로 변환하고 HTML을 PDF로 변환하는 서비스는 이미 여러 사람이나 보석으로 해결되었습니다. 이 서비스는 http://www.pdftoword.com/으로 PDF를 RTF로 변환하고 결과 문서의 이미지를 구분합니다. 그들의 문제는 Windows 서버에서 실행된다는 것입니다. 제가하고있는 응용 프로그램은 Unix 기반 서버에서 실행되는 Ruby on Rails이기 때문에 크로스 플랫폼이 필요합니다.

+0

OpenOffice/LibreOffice의'--headless --convert-to' 기능을 고려해 보셨습니까? 대답으로 게시하지 않을 것입니다, 나는 그것이 작동하는 것을 들었을 뿐이므로 결코 그것을 사용하지 마십시오. – Charles

+0

나는 가지고 있지 않거나 보석 형태로 가질 수 있습니까? – NullVoxPopuli

+0

나는 OOo/LO 인 거대한 바이너리 horribleness를 모두 포함 할 수있는 보석을 만드는 것이 개념적으로 가능하다고 생각하지만, 그것은 어리석은 짓이다.환경을 제어 할 수 있다면 적절한 패키지가 설치되어 있고 롤아웃 중에 바이너리가 예상되는 위치에 있는지 간단히 확인할 수 있습니다. * 환경을 제어하지 않으면 * 아마 비 스타터 일 것입니다. 나는 그들의 시스템에 OOo/LO를 설치하도록 요청할 때 시스템 관리자들로부터 긍정적 인 반응을 기대하지 않을 것이다. – Charles

답변

0

나는 또한 이런 종류의 해결책을 찾고있다. 나는 https://github.com/bagilevi/docx_builder을 보는 것이 더 좋다고 생각한다. 나는 그러나 그것을 아직 시도하지 않았다. 누군가가 더 나은 솔루션을 가지고 올 수 있다면이 글도 http://rubythings.blogspot.com/2011/05/creating-word-documents-in-rails.html

을 읽고, 우리 모두가 내가 html 템플릿에서 docx 파일을 생성하는 작은 보석을 발표했습니다 :)

1

감사 할 것입니다.

https://github.com/docxtor/docxtor

이 제목을 문서화 <h1> 제목을 번역의 포함 주어진 <div>와 페이지 번호, 바닥 글/헤더를 삽입 할 수 있습니다.

모든 워드 프로세서는 docx 형식을 다르게 구문 분석합니다. 결과 파일은 Mac의 Libre Office에서 잘 읽었지만 Google 문서 도구에서는 열리지 않습니다.

보석에 대한 도움이나 의견은 많은 도움이됩니다.

관련 문제