2010-07-28 3 views
0

문제가 있습니다. 앵커 태그에 "title"태그로 구성된 URL 양식 acnchor 태그를 찾고 싶습니다.정규 표현식 : 앵커 태그에서 URL 찾기

example: 
<a href="http://www.test.com" title="xyz">this is test</a> 

어떻게하면 정규 표현식을 사용하여 문자열과 페치 URL을 일치시킬 수 있습니까?

감사

+0

어떤 언어 (.NET, Java, JavaScript, PERL, Python 등)를 사용하고 있습니까? RegEx 구현은 언어마다 다르므로이 질문에 대답하는 것이 필수적입니다. 또한이 유형의 문자열이나 전체 HTML 문서 만 있으면 알려 주시기 바랍니다. – Oded

+0

@Oded : PHP에 –

+0

을 사용하고 있습니다. 질문에 해당하는 태그를 _all_ 사용하십시오. 최대 5 개의 태그가 있습니다. – Oded

답변

4

<a\s+([^>]*)href="(https?:\/\/([^"]*))"\s+([^>]*)title="xyz"(.*?)>(.*?)<\/a> 뒤에 일치 부분 일치 $2, 시도해 볼 수 있습니다 here

+0

속성 값은 일반'>'문자를 포함 할 수 있습니다. – Gumbo

+0

사실, 괜찮 았나? 이 때문에 [ "^"] *'이 (가) – Ties

2

은 그냥 href 속성의 내용을 얻기 위해 HTML 구문 분석 라이브러리를 사용하는 것, 정직합니다.

0

/href="(.*?)(?=".*?title)/

은 경기의 시작부터

/abc(?=xyz)/ 긍정적 예측을 href="을 손질해야합니다 ->이 abcabc 경우 당신에 의해 URL을 얻을 수 있습니다 xyz