www.marktplaats.nl에서 데이터를 긁어 내고 싶습니다. Excel/Access에서 스크랩 된 설명, 가격, 날짜 및보기를 분석하려고합니다.자바 스크립트와 프레임을 사용하는 웹 페이지를 긁습니다.
Ruby (nokogiri, scrapi)로 데이터를 긁어 내려고했지만 아무 것도 효과가 없었습니다. (잘 작동하는 다른 사이트에서) 주요 문제는 예를 들어 selectorgadget과 add-on firebug (Firefox)가 페이지를 긁어 내는데 사용할 수있는 CSS를 찾지 못한다는 것입니다. 다른 사이트에서는 selectorgadget 또는 firebug로 CSS를 추출하여 nokogiri 또는 scrapi와 함께 사용할 수 있습니다. 경험이 부족하기 때문에 문제를 식별하기가 어렵 기 때문에 해결책을 찾는 것이 쉽지 않습니다.
어디에서이 문제를 해결할 수 있는지, 비슷한 긁어 모으는 과정에 대한 정보를 어디서 찾을 수 있는지 알려주세요.
미리 감사드립니다.
시도한 내용과 얻은 결과를 조금 자세히 설명해 주시겠습니까? –
http://www.marktplaats.nl/robots.txt 하단을보십시오. 허가를 요청 했니? 그렇지 않다면 법을 어 기고 있으며 계속한다면 ISP에 블랙리스트에 올리거나보고 할 수 있습니다. – BalusC
Mello : 질문에서 모든 중요한 부분을 제거한 것을 보았습니다. 마크 트랙입니다. 추적하니?! – hoju