2013-03-31 3 views
-1

큰 html 콘텐츠 항목이 있습니다. 배열의 개별 항목으로 일반 텍스트 만 분리해야하므로 번역 도구를 통해 실행 한 다음 원본 HTML로 바꿀 수 있습니다.PHP strip_tags - 배열로 태그 분할

나는 그것을 청소하고 그 다음에 줄을 배열로 나눌 수 있었지만, ...to do this <a href="#" title="blah">click here</a>이라는 글자는 ...to do this click here으로 되돌아왔다.

해당 텍스트의 str_replacea 태그 때문에 더 이상 일치하지 않습니다.

그래서 일반적으로 strip_tags을 사용하여 제거 된 태그를 삽입 된 값으로 변환하여 문자열을 폭발시킬 수있는 방법이 필요합니다.

제안 사항?

+2

DOM을 사용하여 각 섹션에 액세스하십시오. –

+0

휠을 재발 명하지 마십시오. http://simplehtmldom.sourceforge.net/ –

+0

SimpleHtmlDom 대신 http://us3.php.net/manual/en/book.dom.php의 PHP 부분을 사용하십시오. 항상 작동하며 코드를 타사 라이브러리에 묶어 두지 않습니다.이 라이브러리는 실제로이 작업을 수행 할 필요가 없습니다. 덕분에 –

답변

0

괜찮아요, 알아 냈습니다. DOM은이 인스턴스에서 필요한 것보다 더 복잡합니다.

더 간단한 해결책은 정규식 검색을 사용하여 모든 태그를 찾은 다음 html을 그 태그로 구분하는 것입니다.

preg_split('/<.+?>/', $html); 

이것은 단지 텍스트만을 남겨 둡니다. 태그 정보가 필요 없기 때문에 처리하는 것이 더 빠릅니다.