2014-04-06 2 views
0

나는 웹 페이지 아래에 긁어하려고 페이지 구조에서 찾고 (크기 세부 사항)긁어 문제 - 필요 조언

parenturl = http://www.newlook.com/shop/womens/jackets-and-coats/navy-aztec-faux-shearling-collar-parka_286764649?tmcampid=UK_AFF_AffiliateWindow 

srcpage = getURLContent(GET(parenturl)$url,timeout(10)) 
page = htmlTreeParse(srcpage,useInternalNodes = T,encoding='UTF-8') 

, 난 백그라운드에서의 실행 자바 스크립트를 믿고 서버에서 데이터를 가져옵니다. 나는이 웹 페이지를 긁는 방법을 모르겠습니다. 어떤 도움이라도 대단히 감사하겠습니다.

많은 감사를, 사비

답변

3

이 수행하는 셀레늄을 사용하여 볼 수 있습니다 :

require(RSelenium) 
RSelenium::startServer() 
appURL <- "http://www.newlook.com/shop/womens/jackets-and-coats/navy-aztec-faux-shearling-collar-parka_286764649?tmcampid=UK_AFF_AffiliateWindow" 
remDr <- remoteDriver() 
remDr$open() 
remDr$navigate(appURL) 
inventory <- remDr$executeScript("return list;") 
> do.call(rbind.data.frame, inventory) 
color listPrice popupImage skuID 
2    0   2867684 
21    0   2867685 
swatchImage largeImage salePrice 
2         0 
21        0 
detailImage stockLevel size 
2      75 12 
21     133 14 

remDr$close() 
remDr$closeServer() 
관련 문제