scrapy
을 사용하여 웹 사이트의 스크랩 데이터를 스크리닝합니다. 그러나 원하는 데이터는 HTML 자체가 아니라 자바 스크립트에서 가져온 것입니다. 그래서, 제 질문은 :자바 스크립트 내에서 데이터 스크랩하기
그런 경우의 값 (텍스트 값)을 얻는 방법은 무엇입니까? 내가 얻으려고 https://www.mcdonalds.com.sg/locate-us/
속성 : 주소, 연락처, 운영 시간
이것은 내가 화면 스크랩에 노력하고있어 사이트입니다.
크롬 브라우저에서 "마우스 오른쪽 버튼으로 클릭", "소스보기"를 수행하면 HTML에서 이러한 값을 사용할 수 없다는 것을 알 수 있습니다.
편집
SRY 폴, 난 당신이 정말 지금 붙어있어,에 나에게 말했다 admin-ajax.php
를 발견하고 몸을 보았다하지만했다.
json 개체에서 값을 검색하고이를 내 자신의 변수 필드에 저장하려면 어떻게해야합니까? 대중을 위해 하나의 속성을 수행하는 방법과 치료를 시작한 사람들에게도 공유하는 방법을 공유하면 좋을 것입니다. 여기에 내 코드가 짧은, 그래서 내가 어떻게 저장합니까, 긴 편집을 위해 지금까지
Items.py
class McDonaldsItem(Item):
name = Field()
address = Field()
postal = Field()
hours = Field()
McDonalds.py
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
import re
from fastfood.items import McDonaldsItem
class McDonaldSpider(BaseSpider):
name = "mcdonalds"
allowed_domains = ["mcdonalds.com.sg"]
start_urls = ["https://www.mcdonalds.com.sg/locate-us/"]
def parse_json(self, response):
js = json.loads(response.body)
pprint.pprint(js)
SRY의
내 속성에 json 값? 예를 들어 대한
*** 항목 [ '주소'] = * 검색하는 방법 ****
PS, 확실하지 않은이 있지만, 도움이된다면, 내가 사용하는 cmd를 라인에서 이러한 스크립트를 실행
scream crawl mcdonalds -o McDonalds.json -t json (모든 데이터를 json 파일에 저장)
나는 얼마나 고맙다고 느끼는지 충분히 강조 할 수 없다. 나는 그것이 당신에게 이것을위한 시간이 없더라도 u의 이것에게 질문하는 것이 무리하다라고 완전히 알고있을 것이다라는 것을 알고있다.
도움을 준 Tho 정보 Rho는 유익하고 효과적입니다! * 저와 같은 문제를 겪고있는 분들을 위해이 게시물을 확인하십시오 * – HeadAboutToExplode