PHP

2012-07-09 1 views
5

를 사용 가능한 복제를 MS 워드 "HTML"을 제거
What is the best free way to clean up Word HTML?
PHP to clean-up pasted Microsoft inputPHP

나는 클라이언트가 서식있는 텍스트 편집기에 메모를 입력 할 수 있도록, 그리고 최근에 업그레이드 한 ckEditor 3x : MS 워드 클래스, 스타일 및 주석을 기본적으로 제거합니다 (사용자가 편집기 객체에 붙여 넣을 때). 그래서 앞으로 나아가고 있습니다.

나는 최근에 MS 워드 생성 HTML이 포함 된 메모 중 5 년간 메모 정리 작업이 필요했습니다. 이 텍스트 본문을 반복하여 정리해야합니다.

모든 스팬 태그를 제거하지 않아도되며 Microsoft에서 작성한 것으로 식별 된 태그 만 제거 할 수 있습니다.

HTMLCleaner를 사용해 보았지만 MS에서 생성 된 HTML을 제거하지 않았습니다. http://word2cleanhtml.com은 내가 원하는 것을 정확히 수행하지만 개발자는 현재 공개용 API를 제공하지 않습니다 (2012 년 7 월 9 일 기준).

나는 지난 몇 주 동안 그런 수업을 자주 꺼내 보았고 행운이별로 없습니다. 공유하고 싶은 유용한 수업을 찾았습니까?

+0

분명히하기 위해 기존 응용 프로그램에 포함 할 수있는 서버 측 클래스가 필요합니다. 마리오가 언급 한 SO 질문/답변에는 훌륭한 도구가 있지만, 대부분의 경우 원 샷 변환을 위해 디자인되었거나 컬을 사용하여 웹 사이트에 게시하는 것으로 나타났습니다. PHI로는 그럴 수 없습니다. –

+0

Mario, 어디에서 URL을 보내시겠습니까? 그것들은 유용했고, 종결을위한 나의 정당화의 일부였습니다. OP가 회고 스크립트를 사용하여 HTML 정리를 수행하는 것이 유용해야합니다. – halfer

+0

아래 질문에 대한 답변을 maxhud의 답변으로 보내 주시면이 질문을 사용할 수 있기를 바랍니다. htmlpurifier는 사용자가 찾아 보거나 업로드하는 웹 사이트가 아닌 클래스입니다. –

답변