2012-05-29 3 views
0

메신저를 부정하고, 나는 다음과 같습니다 문자열이 : 잘 작동하고 문자열과 같습니다 "dddsome 문자열 ㅋ blahddssssseeeee" 을 cpture 그정규식 표현을 PCRE 정규식 엔진을 사용

<h3 class="description">Description</h3> <div class="wrapper"> dddsome string blah blahddssssseeeee <div class="empty"> </div></div> </div>   </div> 

및 정규 표현식 :

<\s*h3\s*class="*.+?"\s*>.*?</\s*h3>.+?<\s*div.+?class\s*="wrapper"\s*>(.+?)<\s*div\s*class="empty"> 

당분간이 같은이 태그는 내가 모든 일치하지 위의 정규 표현식을 원하는 나타나지 사업부 클래스 = "Aplus의"태그를 보이는 문자열의 거의 동일한 패턴을 가지고 문자열.

<h3 class="description">Description</h3> <div class="wrapper"> <div class="aplus"> dddsome string blah blahddssssseeeee <div class="empty"> </div></div> </div> 
+0

을 숙지하시기 바랍니다 아름다운 스프를 사용 : HTTP ://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – murgatroid99

+0

RE를 사용하여 HTML 구문 분석하기? 언제 그들은 배울 것인가? –

+0

이 정규식을 사용중인 언어/플랫폼은 무엇입니까? – anubhava

답변

0

<div.*>(.*)<div.*> 

을 시도하지만 쉽게 더 나은 웹 폐기 정규 표현식으로 HTML이나 XML을 구문 분석하려는 경우