0
예를 들어 http://basketball.realgm.com/international/league/12/French-LNB-Pro-A/teams과 같은 URL 목록에서 일부 데이터를 긁어내어 모든 팀 이름을 가져 오려고합니다. 아래는 내 스파이더이지만 URL을 통해 실행 중이지만 데이터를 가져 오지는 않습니까?Scular 출력 없음
from scrapy.spider import Spider
from scrapy.selector import HtmlXPathSelector
from teams.items import TeamsItem
class TeamsSpider(Spider):
name = "teamcrawler"
allowed_domains = ["basketball.realgm.com"]
f = open("teamurls.txt")
start_urls = [url.strip() for url in f.readlines()]
def parse(self, response):
hxs = HtmlXPathSelector(response)
titles = hxs.select("/html/body/div[1]/div[2]/table/tbody/tr/td/div[2]/table/tbody/tr")
items = []
for title in titles:
item = TeamsItem()
item["URL"] = title.select("td[1]/a/@href").extract()
item["Team"] = title.select("td[1]/a/text()").extract()
items.append(item)
print items
return items