2009-06-28 4 views
7

Microsoft Word에서 생성 된 html 형식의 문서가 상당히 있습니다. 그것은 지저분하고 지저분한 것들로 가득합니다 (unknow 태그, 네임 스페이스와 다른 비 대한 것들을 알 수 없음)microsoft html doc을 정리하는 방법?

일반 html sytax로 변환 할 수있는 방법이 있습니까?

답변

6

시도 HTML Tidy. 나는 MS Word (적어도 Word 2000까지, 그러나 아마 더 최근 버전에서도)에 의해 생성 된 HTML에서 꽤 잘 작동한다고 들었다.

2

이것은 프로그래밍 관련 질문이 아니지만 Word의 "최신 버전"에서는 Office 관련 태그와 속성을 제거하고 문서에 필요한 태그 만 남겨두고 "필터링 된 웹 페이지"에 저장할 수 있습니다. 웹 브라우저에서 렌더링 될 수 있습니다. 따라서 Word를 사용하는 경우 HTML 문서를 열고 해당 형식으로 저장하려고 할 수 있습니다.

2

아마도 거의 모든 언어로 된 어댑터가있는 HTML Tidy을 찾고있을 것입니다. Microsoft Word HTML 출력 (및 기타 여러 기능)을 정리할 수있는 옵션이 있습니다.

관련 문제