doc 또는 docx를 Java의 HTML로 변환하는 방법. 아파치 POI를 사용하여, 나는 doc로 HTML로 변환 할 수 있었지만 docx를 html로 변환 할 수 없었다? 샘플 코드를 보여 주시겠습니까? 이 코드는 doc에서는 작동하지만 docx에서는 작동하지 않습니다.Doc 또는 Docx를 Java의 HTML로 변환
HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream);
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
wordToHtmlConverter.processDocument(wordDocument);
Document htmlDocument = wordToHtmlConverter.getDocument();
ByteArrayOutputStream out = new ByteArrayOutputStream();
DOMSource domSource = new DOMSource(htmlDocument);
StreamResult streamResult = new StreamResult(out);
TransformerFactory tf = TransformerFactory.newInstance();
Transformer serializer = tf.newTransformer();
serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
serializer.setOutputProperty(OutputKeys.INDENT, "yes");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
out.close();
String result = new String(out.toByteArray());
당신은 예를 참조 그것을 위해 docx4j 사용할 수 있습니다 : https://github.com/plutext/docx4j/blob/master/src/samples/docx4j/org/docx4j/samples/ConvertOutHtml.java –