2009-08-15 2 views
1

Microsoft Word (.doc) 파일의 내용을 C#, .NET 2.0 및 Microsoft.Office를 사용하여 멋지게 형식이 지정된 XHTML로 변환하려고합니다. Interop.Word 네임 스페이스. 이것은 제가 구축하고있는 작은 exe입니다. 자동 빌드 프로세스에 통합 할 수 있습니다. 내가 이것을하고있는 이유는 Word가 "웹 페이지로 저장"에 내장되어 있기 때문에 HTML 생성에 끔찍한 일을하기 때문입니다..NET Microsoft.Office.Interop을 사용하여 .DOC를 XHTML로 변환

나는이 점을 제외하고는 MSDN 참조 (http://msdn.microsoft.com/en-us/library/microsoft.office.interop.word%28office.11%29.aspx)와 워드 문서를 만드는 방법에 대한 자습서 (문서 작성을 허용하지 않는 방식으로 읽지 않음)를 둘러 보았습니다. 다른 형식의) 나는 비어 있습니다.

지금까지 열린 Word 문서의 모든 단락을 반복하여 HTML 단락 태그에 텍스트를 래핑하고 HTML 파일로 출력하는 작은 응용 프로그램이 있습니다. Word에서는 모든 것이 단락으로 처리되므로 현재 단락이 목록, 표, 머리글 등인지 확인할 방법이 없다는 것을 알 수 있습니다. 표, 목록 등에 대한 별도의 모음이 있습니다. 그러나 Microsoft.Office.Interop.Word 네임 스페이스가 제공하는 개체 모델의 내용에서 순서를 파생시키는 방법이없는 것으로 보입니다.

첫째, 달성하고자하는 작업을 수행하기 위해 Microsoft.Office.Interop.Word 네임 스페이스를 사용하는 데 필요한 모든 리소스를 알고 계십니까?

둘째로, 나는 "웹 ​​페이지로 저장"기능을 사용하지 않는 이유에 대한 설명을 앞두고 휠체어를 다시 만들려고 노력하고 있습니다. 또는 접근 방식/기술 선택의 측면에서 잘못된 트리를 짖어 내고 있습니다./코드 라이브러리?

MS Office 2007 이상에서는 Office Open XML 형식 (http://en.wikipedia.org/wiki/Office_Open_XML)에 대한 지원이 점차 늘어나고 있다는 것을 알고 있으므로 좋은 XML 변환이 가능할 수도 있습니다.

또한 분명히 내가 설명하는 유형을 수행하는 데있어 좋은 제품이 있지만 분명히 좋은 오픈 소스 대안으로 보이지 않습니다.

+0

데스크톱 응용 프로그램 또는 서비스 또는 웹 서비스에서이 작업을 수행하고 있습니까? 후자의 두 가지 경우에 사용하는 데 큰 문제가 있습니다. –

+0

이것은 .NET Framework 2.0 및 MS Word 2003이 설치된 컴퓨터에서 실행될 작은 실행 파일입니다. –

답변

-1

Interop이 싫습니다. Interop은 이기 때문에 오레곤처럼 느껴집니다.

Word 2007, "다른 이름으로 저장"-> "다른 형식"에서 문서를 열고 XML 형식 중 하나를 선택하여 System.XML로 결과 XML을 처리 할 수 ​​있습니까? 하나의 XML 문서에서 다른 XML 문서로 변환하는 것은 Interop을 사용하는 것보다 훨씬 쉽습니다.

+0

죄송합니다. Word 2003을 사용하고 있다고 언급 했어야합니다. interop 작업을 정렬 한 것으로 생각합니다. 개체 모델을 필요에 맞게 구부릴 수있는 방법을 결정한 것입니다. –

관련 문제