아래 링크와 비슷한 페이지를 스크래핑하려고합니다. 페이지가 결과를 즉시로드하지는 않습니다.로드하기 전에 페이지 끝까지 스크롤 할 때까지 기다립니다. 더 많은 결과. 따라서 아래의 코드가 실행되면 지금까지로드 된 결과 만 가져옵니다 (이 예에서는 20,000 개 중 16 개). 지금이 기본 코드를 사용하여R, relenium 내의 전체 xml 페이지 다듬기
https://www.rbauction.com/search?id=ar®ion=Europe&s=YXI3fE49NDI5NDk1NzE5MCs0Mjk0MjM4MzMy
:
는require(relenium)
require(XML)
firefox=firefoxClass$new()
url="https://www.rbauction.com/search?id=ar®ion=Europe&s=YXI3fE49NDI5NDk1NzE5MCs0Mjk0MjM4MzMy"
url=sprintf(url)
firefox$get(url)
doc=htmlParse(firefox$getPageSource())
title=xpathSApply(doc, "//div[@class='display-text']",xmlValue)
title
에만 웹 페이지의 첫 번째 16 "제목을"생산 (20,000 이상이있다). 어떤 아이디어?
돈