"huis"(네덜란드어로 "house")가 포함 된 모든 링크를 추출하여 웹 사이트를 긁어 내려고합니다. http://doc.scrapy.org/en/latest/topics/spiders.html에 따라, 나는 이전 포스트 (Scrapy Error: TypeError: __init__() got an unexpected keyword argument 'deny') 그것이 가능한 이유처럼 보인다에서 오류 메시지Sciece error : TypeError : __init __() 예기치 않은 키워드 인수 'callback'이 있습니다.
Rule(LinkExtractor(allow=r'.*huis.*', callback='parse_item'))
TypeError: __init__() got an unexpected keyword argument 'callback'
받고 있어요, 그러나
import scrapy
from scrapy.spiders import CrawlSpider, Rule
from scrapy.linkextractors import LinkExtractor
from Funda.items import FundaItem
class FundaSpider(scrapy.Spider):
name = "Funda"
allowed_domains = ["funda.nl"]
start_urls = [
"http://www.funda.nl/koop/amsterdam/"
]
rules = (
Rule(LinkExtractor(allow=r'.*huis.*', callback='parse_item'))
)
def parse_item(self, response):
item = FundaItem()
item['title'] = response.extract()
return item
을 시도하고있어 등이 일치하지 않는 브라켓입니다 키워드가 LinkExtractor
대신 Rule
으로 전달되었습니다. 그러나이 경우에는 callback
이 의도 한대로 괄호안에있는 것으로 보입니다.
어떤 아이디어가이 오류의 원인입니까?