HTML 내용을 포함하는 문자열에서 (<a>
과 <span>
태그 사이의) 텍스트를 추출하고 싶습니다.정규 표현식 패턴 일치
내 패턴은 다음과 같습니다 :
$pattern='/<a[^(span)][\/\(\)-:@!%*>#=_|?$&";.\w\s]+<\/a> <span/um';
내가 <a
의 첫번째 발생 및 <span
의 마지막에 나타나는 모두의 첫번째 발생 간격이 텍스트와 텍스트로 출력을 얻을.
예를 들어, HTML 콘텐츠 :
<a href="#">asdasdasd</a> <span blah blah></span> blah blah <a>blah </a> <span>blah
원치 :
<a href="#">asdasdasd</a> <span
은 방법 :
<a href="#">asdasdasd</a> <span blah blah></span> blah blah <a>blah </a> <span
I입니다 이 정규식 파싱 html을 사용하지 않는 것이 좋습니다 귀하의 질문에 대답하지 않습니다 알아요. 왜이 [dom parser] (http://simplehtmldom.sourceforge.net/)와 같은 것을 시도하고 시간을 절약하십시오. – noel
적절한 파서를 사용하십시오. –
dom 파서를 알고 있지만 regex cause를 사용하면해야 할 일이 있습니다. 정규 표현식 학습. –