2010-04-17 2 views
0

가능한 중복 :
RegEx match open tags except XHTML self-contained tagsRegExp를 사용하여이 사이트의 데이터를 어떻게 grap 할 수 있습니까?

내가 정규식 http://www.islamqa.com/en/ref/20494 클래스 = "주제 용기"와 사업부에서 특별히 데이터를 사용하여이 사이트

에서 데이터를 그랩 할 내가 시도 :

/<div class="subject-container">(.*?)<\/div>\s*/is 

하지만 저에게 줬습니다. 무효 RegExp

왜? HTML 코드 내부

+1

정규 표현식으로 HTML을 구문 분석하지 마십시오. 사용중인 언어를 알려 주시면 간단하고 효과적인 HTML 구문 분석 라이브러리를 제안 할 수 있습니다. –

+1

평생 고통과 고통을 원한다면이 경로를 사용할 수 있습니다. HTML을 정규식으로 구문 분석하지 마십시오. –

답변

0

:

 
<div class="subject-container" > 

가능성이 놓친 한 공간

 
/<div class="subject-container"\s*>(.*?)... 
관련 문제