나는 치료를 사용하여 here에서 결과를 긁어 내려고합니다. 문제는 '더 많은 결과로드'탭을 클릭하기 전까지는 모든 클래스가 페이지에 표시되지 않는다는 것입니다. Scrapy의 다음 페이지로 어떻게 이동할 수 있습니까
문제
여기에서 볼 수있다 :내 코드는 다음과 같습니다 :이 웹 사이트에 대한
class ClassCentralSpider(CrawlSpider):
name = "class_central"
allowed_domains = ["www.class-central.com"]
start_urls = (
'https://www.class-central.com/courses/recentlyAdded',
)
rules = (
Rule(
LinkExtractor(
# allow=("index\d00\.html",),
restrict_xpaths=('//div[@id="show-more-courses"]',)
),
callback='parse',
follow=True
),
)
def parse(self, response):
x = response.xpath('//span[@class="course-name-text"]/text()').extract()
item = ClasscentralItem()
for y in x:
item['name'] = y
print item['name']
pass
두 번째 페이지의 URL은 어떤 모양입니까? 그것의 경우처럼 www.website.com/Recently_Added/2 그때는 정말 간단한 해결책이 될 것입니다. 또는 실제로 더 많은 결과를로드하는 데 나타나는 데이터를 가져 오려고합니까? – SAMO
작동하지 않습니다. 나는 2 페이지의 URL을 얻는 방법을 모르거나 [다음에 ..를로드하십시오] – Yato
예를 들어 보겠습니다. URL이 명백한 패턴으로 바뀌면 그것을 활용할 수 있다고 말하고 있습니다. 그러면 결과를 '더 많은 결과로드'탭에서 얻으려고하는 것입니다. – SAMO