2016-06-11 1 views
1

웹 사이트에서 데이터를 스크랩하고 싶지만 해결 방법이 가장 작은 작은 문제가 발생했습니다. enter image description here긁힌 데이터 양식 ClickTracking

: (처음 스크 레이 핑 도구, BeautifulSoup로하고 요청 사용) 를 나는 바로 "07xx의 XXX에 XXX"나는 먼저 그것을 페이지를 열고 요청하면

, 나는이 얻을에 전화 번호가 필요합니다 내가 전화 번호가 필요하지만 "Arata telefon"을 누르기 전까지는 표시되지 않습니다.이 정보를 어떻게 가져갈 수 있습니까? 여기

는 페이지 자체입니다 : 당신은 그냥 즉 URL에서 ID를 전달해야 Link

답변

1

6rqd4http://olx.ro/ajax/misc/contact/phone에 : 당신은 당신이 스크랩 한 URL을 많이 그래서 만약

In [22]: import requests 

In [23]: requests.get("http://olx.ro/ajax/misc/contact/phone/6rqd4").json() 
Out[23]: {'value': '0787 636 258'} 

, 당신 정규식으로 ID를 추출 할 수 있습니다 :

In [30]: import requests 

In [31]: from bs4 import BeautifulSoup 

In [32]: import re 

In [33]: patt = re.compile("ID(\w+)\.html") 

In [34]: url = "http://olx.ro/oferta/chirie-zona-camine-hasdeu-fac-medicina-apartament-2-camere-78-mp-ID6rQD4.html#" 

In [35]: requests.get("http://olx.ro/ajax/misc/contact/phone/{}".format(patt.search(url).group(1))).json() 
Out[35]: {'value': '0787 636 258'} 
답변에 대한
+0

감사 것은 내가 N 긁어 데이터베이스를 만들고 싶어 나는 것입니다 모든 전화 번호 eed 특정 하나가 아니야 : ( –

+0

내 나쁜, 죄송합니다 :) 대단히 감사합니다! –