2016-08-19 2 views
0

Chrome을 통해 수동으로 사이트를 탐색 한 후에 소스 HTML을 볼 때 전체 페이지 소스를 볼 수 있지만 셀 소스를 통해 페이지 소스를로드 할 때 전체 페이지 소스가 표시되지 않음 .Selenium에서 전체 페이지 소스를 볼 수 없음

from bs4 import BeautifulSoup 
from selenium import webdriver 
import sys,time 


driver = webdriver.Chrome(executable_path=r"C:\Python27\Scripts\chromedriver.exe") 
driver.get('http://www.magicbricks.com/') 


driver.find_element_by_id("buyTab").click() 

time.sleep(5) 
driver.find_element_by_id("keyword").send_keys("Navi Mumbai") 

time.sleep(5) 
driver.find_element_by_id("btnPropertySearch").click() 

time.sleep(30) 

content = driver.page_source.encode('utf-8').strip() 

soup = BeautifulSoup(content,"lxml") 

print soup.prettify() 
+0

당신은 당신이 webdriver에 놓치고있는 페이지 소스를 추가 할 수 있습니까? – Grasshopper

+0

줄'driver.get ('http://www.magicbricks.com/')'의 뒤에'time.sleep (5)'또는 다른 임의의 시간을 넣으려고 했습니까? 찾고자하는 구성 요소를 사용할 수있을만큼 빨리 페이지가로드되지 않을 수도 있습니다. –

+0

또한 사이트를 사용할 때 나타나는 팝업이 나타났습니다. 이 팝업 때문에 "btnPropertySearch"버튼을 두 번 클릭해야했습니다. 나는 모든 소스 코드를 볼 수있었습니다. 당신이 볼 수없는 것에 대해 더 자세히 설명해 주시겠습니까? –

답변

0

웹 사이트에서 셀렌에 대한 사용자 에이전트를 차단하거나 제한 할 수 있습니다. 쉬운 테스트는 사용 도구를 바꿔서 사용하는지 확인하는 것입니다. 이 질문에서 더 많은 정보 :

Change user agent for selenium driver

가 인용 :

from selenium import webdriver 
from selenium.webdriver.chrome.options import Options 
opts = Options() 
opts.add_argument("user-agent=whatever you want") 

driver = webdriver.Chrome(chrome_options=opts) 
관련 문제