파이썬 스콥을 사용하여 스파이더를 실행하고 있는데, 이는 http://www.amazon.co.uk/gp/product/B003ZDXHSG/ref=s9_simh_gw_p23_d0_i3?pf_rd_m=A3P5ROKL5A1OLE&pf_rd_s=center-2&pf_rd_r=1NWN2VXCA63R7TDYC3KQ&pf_rd_t=101&pf_rd_p=467128533&pf_rd_i=468294
과 같은 매개 변수 (예 : &
기호)가있는 페이지를 제외한 모든 페이지를 스크랩하고 있습니다. 정말 시간 내 주셔서 감사합니다 다음 SgmlLinkExtractor rule
스크립트를 사용하여 매개 변수화 된 URL 스크랩
rules = (
Rule(SgmlLinkExtractor(allow='[a-zA-Z0-9.:\/=_?&-]+$'),
'parse',
follow=True,
),
)
으로 CrawlSpider
를 사용하고 사전에 감사 할 수있는 권한을 가지고 싶습니다 [scrapy] ERROR: xxx matching query does not exist.
오류 로그는 말한다.
CrawlSpider의 콜백에 '구문 분석'이름을 지정할 수 없습니다. http://readthedocs.org/docs/scrapy/en/latest/topics/spiders.html#crawling-rules를 참조하십시오. – groovehunter