2012-02-03 3 views
1

preg_match_all ("/ \ (. *?) \ </a"/ $ this-> page [ "Title"], $ matches);preg_match_all imdb 페이지에서 장르를 가져 오는 쿼리

남자, $ this-> page [ "Title"]은 http://uk.imdb.com/title/tt1285016/과 같은 페이지의 내용입니다. 영화와 관련된 장르 목록을 가져와야합니다. [Action | 드라마 | Sci-Fi]

정규 표현식에 대해 알고 싶지 않습니다. 나는 항상 패턴 매칭을 싫어했다.

도움이 정말 감사 할 것입니다. 고마워.

포인트 : 수정해야 할 기존 코드입니다. 이것은 PHP입니다.

+0

관련 : http : // st ackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – Lix

+0

다른 'write my regex'질문입니다. 먼저 장르에 필요한 정확한 블록을 추출하십시오. 적어도 시도해! 당신이 제공 한 정규 표현식은 깨졌으며 심지어 그것이 정확하다해도으로 끝나는 문자열과 일치합니다. – Evert

+0

정확한 정규 표현식을 게시 할 수 없습니다. 파서가 가져 가지 않습니다. –

답변

1

preg_match_all('#/genre/[^>]+>([^<]+)<#',$this->page["Title"],$matches); 
+0

감사합니다. 이건 정말 효과적입니다. –

2
을 시도 배울 수있는 링크를 따라

더 잘 작동합니다.

+0

http://sourceforge.net/projects/imdbphp/에서 최신 IMDB 스크래퍼를 사용할 수 있습니다. – Imtiaz

관련 문제