2014-05-19 5 views
0

에서 데이터를 추출하는 방법 winxip 또는 winrar 도구를 사용하여 docx 파일을 열어 모든 XML 파일을 볼 수 있기 때문에 xml 파일에서 데이터를 추출하고 싶습니다. 질문은 .. 1. 코드를 사용하여 docx 문서의 모든 XML 파일을 추출하는 방법은 무엇입니까? 2. 실제 데이터가 word/document.xml 안에 있기 때문에 구문 분석을 어떻게 진행해야합니까? 나는 저를 도와주세요 DOM과 XML 파싱에 새로운 오전JXX를 사용하여 docx xml을 구문 분석하여 docx

...

+0

(자바 세계에서는) docx4j 또는 POI와 같은 상위 수준의 API를 고려해보십시오. – JasonPlutext

답변

1

내가 당신에게 코드를 작성하지 않습니다,하지만 당신이해야 할 단계는 다음과 같습니다

  • 내용을 읽어 DOCX 파일
JDOM에 콘텐츠를 전달하는 '단어/document.xml'파일
  • 의 내용을 가져 압축을 풉니 다

    질문이 구체화되면 새로운 질문을 게시하십시오.

  • +0

    네, 고맙습니다 .. 저는 ZipinputStream을 사용하여 말한 것처럼 doc라는 단어의 압축을 풉니 다. 그리고 나와 함께 'word/document.xml'파일을 가지고 있습니다 ... JDOM에 완전히 익숙해 져서 어떻게 진행할 수 있습니까? JDOM을 배울 때 ?? .. 나는 DOM에 대한 기본적인 생각을 가지고있다. (XML의 트리 구조체를 제공한다.) 다음 단계는 무엇이겠습니까 ?? –

    +0

    좋습니다. 지금 JDOM에 내용을 전달하십시오 – edi9999

    +0

    JDOM은 무엇입니까 ?? 그것은 어떤 항아리 파일입니까 ?? –