WordToHtmlConverter
이라는 변환기가 있지만 처리 방법이 공개되지 않습니다. doc 파일을 전달하고 HTML 파일 (또는 OutputStream
)을 얻는 방법은 무엇입니까?Apache POI를 사용하여 Word를 HTML로 변환
9
A
답변
18
이 코드는 현재 나를 작동시키고 있습니다.
HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(new FileInputStream("D:\\temp\\seo\\1.doc"));
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
DocumentBuilderFactory.newInstance().newDocumentBuilder()
.newDocument());
wordToHtmlConverter.processDocument(wordDocument);
Document htmlDocument = wordToHtmlConverter.getDocument();
ByteArrayOutputStream out = new ByteArrayOutputStream();
DOMSource domSource = new DOMSource(htmlDocument);
StreamResult streamResult = new StreamResult(out);
TransformerFactory tf = TransformerFactory.newInstance();
Transformer serializer = tf.newTransformer();
serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
serializer.setOutputProperty(OutputKeys.INDENT, "yes");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
out.close();
String result = new String(out.toByteArray());
System.out.println(result);
+0
전체 코드를 얻을 수 있습니다 ..? –
+0
감사합니다. 론. 네 제안이 나를 구 했어. 제공된 샘플을 시도했지만 다이어그램 (예 : 상자) 내에서 이미지, 표 및 내용을 건너 뜁니다. 그것도 추출 할 방법이 있습니까? 이미지를 따로 따로 추출하는 몇 가지 예를 보았습니다. 모두 함께 할 수있는 방법이 있습니까? 그렇지 않으면 원본 파일의 위치에 정확히 같은 이미지, 표를 배치 할 수 있습니다. "doc 파일을 HTML 컨텐트로 렌더링"(이미지, 표, 다이어그램 등을 건너 뛰지 않음) 요구 사항을 충족시키는 수단 –
관련 문제
- 1. Apache Poi를 사용하여 doc 파일을 html로 변환하십시오.
- 2. Apache poi를 사용하여 ppt를 png로 변환
- 3. Apache POI를 사용하여 MS Word를 구문 분석하고 XML로 변환 할 수 있습니까?
- 4. Apache POI를 사용하여 Excel에 저장 번호
- 5. poi를 사용하여 ms 단어 2007을 변환
- 6. . apache poi를 사용하여 .xlsx 파일을 쓰는 방법
- 7. Apache POI를 사용하여 XWPFParagraph의 텍스트 업데이트
- 8. RegEx에서 Apache POI를 사용하여 대문자 단어를 추출
- 9. apache poi를 사용하여 Excel에서 숨겨진 셀 감지
- 10. Apache POI를 사용하여 pptx에서 테이블 만들기
- 11. Apache POI를 사용하여 WinWord doc에서 텍스트 바꾸기
- 12. Apache POI를 사용하여 Excel 시트 복사
- 13. Excel Apache POI를 사용하여 목록 드롭 다운
- 14. Apache POI를 사용하여 Powerpoint 슬라이드에 메모 추가
- 15. Apache POI를 사용하여 xlsx 형식으로 파일 작성
- 16. Apache POI를 사용하여 Excel에서 XML을 작성하십시오.
- 17. Apache POI를 사용하는 셀 쉐이딩
- 18. Microsoft Word를 사용하여 서버에 PDF 파일을 만듭니다. Word를 종료하려면 어떻게합니까?
- 19. xssf eventusermodel을 사용하여 Excel에서 apache poi를 사용하여 주석 달기 3.7
- 20. PDF를 Python을 사용하여 HTML로 변환
- 21. PHP를 사용하여 xml을 html로 변환
- 22. 정렬을 사용하여 XML에서 HTML로 변환
- 23. 아파치 POI를 사용하여 텍스트를 얻지 않고 .docx를 html로 변환하기
- 24. Apache POI를 사용한 Excel 통화 형식
- 25. Apache POI를 사용하여 .docx 파일의 페이지 헤더 업데이트
- 26. Apache POI를 사용하여 서식 복사를 중지 할 수 있습니까?
- 27. Apache POI를 사용하여 템플릿 파일에 매크로를 복사 하시겠습니까?
- 28. apache poi를 사용하여 Excel 파일에서 페이지보기 모드 설정
- 29. Java에서 Apache POI를 사용하여 Excel에서 차트를 만드는 방법은 무엇입니까?
- 30. apache poi를 사용하여 HSLF (excel)를 HSLF (ppt)에 포함
이것은 무엇입니까? http://stackoverflow.com/questions/227236/convert-word-doc-to-html-programmatically-in-java – enrique2334
아파치 POI에는 org.apache.poi 패키지의 새 클래스가 있습니다. .hwpf.converter 그걸 처리 할 수 있지만 그들을 사용하는 방법에 대한 자습서를 찾을 수 없습니다. – Ron