웹 사이트에서 새 책을 얻을 수있는 스크립트를 만들려고합니다.두 개의 서로 다른 태그 사이에서 캡쳐 할 정규식과 숫자
저는 preg_match_all을 사용하고 있습니다. 얻을 수있는 7 가지 정보가 있습니다. 제목, 저자, 편집자 ...
내 preg 매치 마스크를 만드는 데 문제가 있습니다. 예를 들어 여기에서 제품 코드가 필요합니다. 각 페이지에는 3 ~ 10 개의 코드 제품이 있습니다. : 그것은 작업의
$mask ="/Réf :(.*)<\/li>/Us";
,하지만 난 단지 숫자를 원하는 : 처음에는
<li><label>Réf : </label>21608</li>
나는이 노력하고있어. 나는 정규식 가이드를 웹상에서 검색하고 있지만이 코드 제품은 두 태그 (예 : <open>...</open>
) 사이에 있지 않으므로 내 목표에 구문을 사용하는 방법을 이해하지 못한다. 이 코드 제품에는 4 또는 5 개의 숫자가 있습니다.
도움 주셔서 감사합니다.
당신이 XML/HTML을 구문 분석하려는 경우, 그것은 거의 항상 실제 파서를 사용하는 더 나은 아이디어, 오히려입니다 regex를 사용하는 것보다. –
참고 : http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –