잘못된 태그를 제거하는 가장 좋은 방법은 무엇입니까? 이 간단한 예제보다 더문자열에서 잘못된 태그를 제거하는 가장 좋은 방법
<q>7</q> (<q>96</q><q>2</q>) <q>9</q><q>3</q><q>7</q> <q>4</q><q>2 2</q><q>4</q>
더 :이 같은 태그 예를 들어
에 포함되어있는 경우
태그는이 라인
<q>+7</q> (<q><q>9</q>6</q><q>2</q>) <q>9</q><q>3</q><q>7</q> <q>4</q><q>2 2</q><q>4</q>
후
제거 잘못된 태그, 잘못
이전 :
<p>bla-bla <p>bla-bla</p> bla-bla</p>
은 후 :
<p>bla-bla bla-bla bla-bla</p>
http://htmlpurifier.org/를 사용해보십시오. – jeroen
X/HTML 사양 *에 따라 * 잘못된 *을 의미하는 * 경우 XML 파서를 사용해야합니다 (PHP에서는 [DOMDocument] (http://php.net/dom)). – Sherif
또한 준수하는 모든 XML 파서가 해당 태그를 허용 할만한 가치가 있습니다. HTML과 같은 언어는 의도적으로 무차별 적이기 때문에 여러분이 기대하는 것과 관련이 없습니다. 사양,'
foo는
바
바즈에 따르면'단지'foo는
바
바즈
'가 발생합니다. 새 문장을 열기 전에 첫 번째 단락 태그를 닫으려는 의도가 있다고 가정합니다. 그래서 당신에게 암묵적으로 도움이됩니다. – Sherif