2012-04-23 3 views
0

정규식이 필요합니다.이 태그는 닫히지 않은 태그를 제공하며,이를 찾아 프로그래밍 방식으로 닫을 수 있습니다.닫지 않은 HTML 태그를 찾아서 닫는 정규식

처럼, 나는이에서 닫히지 않은 태그를 찾을 정규식을 사용하여 닫으려면 텍스트

<tag> 
<p> hello world <p> this is <p>test.</p> this is test. <p> end it 
</tag> 

아래에 있습니다.

어떤 아이디어 ?? 감사합니다 메가 나

+0

개인적으로 큰 문제는 태그가 닫히는 장소, 1) 개봉 직후 닫을 수 있음, 2) 다음 태그가 발견되면 닫을 수 있음 (3) type 태그가 발견되었습니다 (거의 쓸모 없습니까?) 그리고 태그, 태그의 태그 등을 닫는 방법에는 여러 가지가 있습니다. 찾고있는 것을 찾기가 쉽지 않습니다. –

+0

다음 태그가 시작되기 전에 닫을 수 있습니다. – meghana

답변

6

정규식은이 작업에 적합한 도구가 아닙니다. 이유에 대한 설득력있는 설명은 here을 참조하십시오.

HTML Agility Pack을 사용하여 HTML을 구문 분석하고 다시 작성하는 것이 좋습니다.

+1

+1은 html을 구문 분석하기 위해 정규식을 사용하지 않습니다. - http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html – brendan

+0

답장을 보내 주셔서 감사합니다. 나는이 HTML을 XML로 취급합니까 ?? – meghana

+0

여기에 Oded와 동의하십시오. 민첩성 팩은 파싱에 용서가되며 이후에 잘 구성된 html을 출력 할 수 있습니다. 아무 것도 줄무늬가되지 않는지 테스트하십시오 (주석, 중요한 공백을 생각하십시오). 민첩성 팩은 완벽한 출력물에 가까울 것이지만 호출 할 수있는 옵션을 조사해야합니다. – buckley

관련 문제