여기 내 코드입니다. 내 parse_item 메소드가 호출되지 않습니다.치료 parse_item 메서드가 호출되지 않습니다
from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from scrapy.selector import HtmlXPathSelector
class SjsuSpider(CrawlSpider):
name = 'sjsu'
allowed_domains = ['sjsu.edu']
start_urls = ['http://cs.sjsu.edu/']
# allow=() is used to match all links
rules = [Rule(SgmlLinkExtractor(allow=()), follow=True),
Rule(SgmlLinkExtractor(allow=()), callback='parse_item')]
def parse_item(self, response):
print "some message"
open("sjsupages", 'a').write(response.body)
당신이 수에 대한 값을 지정해야합니까? :로
또한, 규칙을 작성할 수 있습니다 나는 당신의 거미가 분석 할 품목을 찾지 못하고 있다고 생각합니다. – dm03514
나는 모른다. 그러나 그것은 의미가있다. 내가 모든 것을 스크랩하고 싶다면 허용 할 수있는 것은 무엇인가. – riship89