2011-03-21 3 views
0

.doc가 나에게 이메일로 전송되는데,이 파일에는 본문과 .doc 또는 .pdf 및 모든 메시지를 추출하는 python 스크립트를 작성하고 있습니다. 그들은 보냈을 수도 응답에 따라 더 할 수 있습니다, 그리고 난 내 웹 서버에 보내고 디스플레이를위한 PHP 스크립트 형식을 가지고 싶습니다.html로 단어 문서를 표시하는 쉬운 방법이 필요합니다.

웹 서버에 대한 셸 액세스 권한이없고 PHP가 유일하게 지원되는 언어 (예 : 종류)를 알고 있기 때문에 가정용 컴퓨터에서 변환하고 싶습니다. 바탕 화면에서 저는 파이썬, C, C++에 대해 열었습니다.이 모든 것들이 제가 잘 알고 있고 직업에 더 적합합니다. 가능한 경우 서식을 유지하고 싶습니다. 큰 프로젝트를 만들지 않으려 고합니다. 너무 복잡하면 항상 .doc을 업로드하고 로컬로 열 수 있습니다.

+0

너무 많지 않은 경우 손으로 HTML로 저장하지 않으시겠습니까? –

답변

0

MS Word 콘텐츠 추출에 antiword를 사용하십시오.

http://www.winfield.demon.nl/

당신은 기본 서식을 유지하기 위해 XML 출력 형식을 선택할 수 있습니다. 그런 다음 XSLT를 사용하여 HTML 서식을 지정할 수 있습니다.

2

다양한 Word to HTML 변환기 - 상용 및 오픈 소스 변환기가 있습니다. 가장 일반적인 변환기 (오픈 소스)는 "wv"입니다. 예를 들어 Open Office를 사용할 수도 있습니다. PyUNO 브리지를 사용합니다 (실행중인 OpenOffice 서버 필요). Windows를 사용하는 경우 설치된 Office 설치를 다시 사용하여 다양한 상용 솔루션을 사용할 수 있습니다. 일반적으로 Google : 귀하 자신의 필요와 요구 사항에 따라 Google을 선택하고 변환기를 선택하십시오.

1

이 작업에는 Doc To HTML Converter을 사용할 수 있습니다. 이 응용 프로그램은 PC에 설치되며 일괄 처리 모드로 많은 입력 MS Word 문서를 한 번에 변환하며 MS Word를 사용하여 원본 콘텐츠에 액세스합니다. 이 프로그램은 MS Word에 내장 된 (X) HTML 생성 엔진을 사용하지 않지만 컴팩트 한 코드 작성을 위해 자체 구현을 사용합니다. 또한 인터넷을 통해 작업을 수행 할 필요가 없습니다.

관련 문제