나의 아이디어는 Groupon의 웹 사이트를 탐색하여 거래의 URL을 추출하는 것이 었습니다. (이 페이지의 : http://www.groupon.de/alle-deals/muenchen/restaurant-296) 문제는이 같은 datas를 찾기 위해 그루 폰의 페이지에 findall은을 할 노력하고있어 것입니다 웹 페이지에서 데이터를 긁어 모으는 Python Regex
"category":"RESTAURANT1","dealPermaLink":"/deals/muenchen-special/Casa-Lavecchia/24788330", and I'd like to get the 'deals/muenchen-special/Casa-Lavecchia/24788330'.
내가 밤새 시도하지만 올바른을 찾을 수 없습니다 해요 정규식. 나는 시도했다 :
import urllib2
import re
Page_Web = urllib2.urlopen('http://www.groupon.de/alle-deals/muenchen/restaurant-296').read()
for m in re.findall('category*RESATAURANT1*dealPermaLink*:?/*/*/*/*\d$',Page_Web):
print m
그러나 아무것도 인쇄하지 않는다.
살펴볼 시간이 있다면 BeautifulSoup 및 Requests 라이브러리는 Python에서 스크랩을 만들 수 있습니다. 훨씬 쉬워. –
왜 [groupon api] (http://www.groupon.com/pages/api)에 등록하여 안전하고 편리하며 합법적 인 방법으로 목표를 달성하지 않습니까? – J0HN