2010-11-19 7 views
9

Python 용 HTML to PDF 변환 라이브러리 인 pisa를 사용하고 있습니다.html로 파이썬의 .doc 변환기?

Word 문서에도 Python 용 HTML에서 .doc 변환 라이브러리가 있습니까? 그러나

+0

0으로, HTML은 10 필터링? MS 워드는 HTML을 읽을 수 있습니다. – MSalters

+0

나는 똑같은 문제가있다. 나는 pisa를 사용하여 pdf로 변환하는 html을 가지고 있으며, 같은 말을하고 싶다. 그 큰 문서, ~ 20 페이지, 같은 코드 조각을 사용하여 HTML을 생성 한 다음 피사 또는 다른 것을 통해 내보내는 것이 좋을 것입니다. –

+0

@ Eric : 최근에 같은 문제가있었습니다. 궁금한 점은 HTML을 Word .docx로 변환하는 솔루션을 찾았습니까? 감사. –

답변

3

나는 당신이 변환 할 수 있습니다 직접 모듈을 인식하지 오전하지만, :

  1. 당신은 일반 텍스트 먼저 html2text 모듈을 사용하여HTML로 변환 할 수 있습니다.
  2. 그런 다음 python-docx 모듈을 사용하여 의사 또는 docx 파일로 텍스트를 변환 할 수 있습니다.
9

당신은 MS 워드가 당신을 위해 그것을 변환 할 수 있도록, Windows 용 pywin32 파이썬 확장에서 win32com을 사용할 수 있습니다. 간단한 예 :

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 

doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 

word.Quit()