다중 문자열까지의 내용에 맞게 ...정규 표현식 내가 그 다음과 같습니다 오는 결함이 입력을 가지고
foo<p>bar</p>
그리고 AP 태그에서 최고의 텍스트를 포장을 정상화하려면 :
<p>foo</p><p>bar</p>
이 <p>$1</p>
와 /^([^<]+)/
의 대체 정규식 충분히 쉽다.
foo <b>bold</b><p>bar</p>
이 새로운 페이지에서 전체 덩어리 포장한다 :
<p>foo <b>bold</b></p><p>bar</p>
을하지만 간단한 정규식 <
만 보이는 때문에 문제는 때때로 주요 덩어리과 같이 페이지가 아닌 다른 태그를 포함입니다 그것은 <b>
에서 멈추고 밖으로 뱉어 :
<p>foo </p><b>bold</b><p>bar</p> <!-- oops -->
을 그래서 <p
일치하는 정규 표현식을 다시 어떻게? 명백하게 대답은 부정적 예측을 포함하지만, this은 나에게 너무 깊은 것입니다.
(그리고 "당신이 정규 표현식에와 HTML을 구문 분석 할 수 없습니다!"코멘트를 피할 수는 입력하지 임의 HTML,하지만 태그 <p>
, <a>
, <b>
및 <i>
을, 그리고 A/B로 주석을 일반 텍스트 전에/나는 중첩되지 않을 수 있습니다.)
+1. –