2010-04-18 2 views

답변

5

모든 .doc 파일은 binary format에 저장됩니다. 이것들을 열고 조작하는 것은 고통의 운동이다.

모든 .docx 파일은 실제로 ZIP 형식으로 저장된 XML 파일의 모음입니다. 맞습니다. .docx 또는 .xmlx 또는 .pptx의 확장명을 .ZIP으로 변경하면 다른 ZIP 파일과 마찬가지로 파일을 열 수 있습니다. MS는 Office Open XML이라는 형식의 API도 있습니다. 개인적으로 OOXML API는 꽤 익숙한 학습 곡선을 가지고 있다고 생각합니다. Word 파일을 만들거나 조작 할 때 샘플 파일을 만들고 압축을 풀고 내부를 조작합니다. IMO OOXML 파일의 기초는 큰 오래된 API 없이도 사용할 수있을만큼 간단합니다. ...

+0

간단한 단어 파일을 시험해보기에 좋은 시작점을 주셔서 감사합니다. 나는 확실히 그것을 볼 것이다. 나는 이제 몇 가지 아이디어를 가지고있다! – ComethTheNerd

2

모든 MS Word 문서가 XML 형식으로 일련 화되어 있습니까?

짧은 대답 : 아니오.

긴 대답 : 몇 가지 릴리스가있을 때마다 MS는 워드 문서의 형식을 변경했습니다. 따라서 Word 6.0에서 95는 Word 97에서 2002 (a.k.a. XP) 형식을 사용하고 다른 형식은 2003, 또 다른 형식은 2007, 또 하나는 2007 형식을 사용합니다.

물론 각 버전은 이전 형식으로 문서를 저장하고 열 수 있지만 새로운 형식은 일반적으로 이전 형식으로 저장할 수는 없습니다.

2003 년 (.doc)까지의 형식은 이전 버전의 증분 업그레이드이며 2 진수입니다.

Office 2007 (.docx)에서 도입 된 형식은 XML 기반이며 단어 자체가 해당 표준과 완전히 호환되지는 않지만 ISO 표준 "ISO/IEC 29500 : 2008 Office Open XML"로 강제되었습니다. Word 2007은 이전의 이진 형식으로 문서를 저장하고 열 수 있습니다.

희망이 도움이됩니다.

+0

많은 감사합니다, 확실히 도움이되지만 그것은 내가 기대했던 것보다 훨씬 더 복잡해 보입니다! – ComethTheNerd