파이썬 2.7.12에서 문제가 생겨서 일부 웹 페이지 데이터를 긁어 모으기 위해 BeautifulSoup을 사용했지만, 특정 'title ='태그를 긁는 방법을 알 수 없습니다. <a href link </a>
파이썬으로 <a href 태그 내 데이터를 grap하는 방법 BeautifulSoup
내에서 지금까지이 코드와 출력을 얻을 :
<a href="/da/player/123/lionel-messi/" title="Lionel Messi">Lionel Messi</a>
사람이 스펙을 얻기 위해 도와 주 시겠어요 :
import urllib2
from bs4 import BeautifulSoup
hdr = {'Accept': 'text/html,application/xhtml+xml,*/*',"user-agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36"}
url = 'REMOVED'
req=urllib2.Request(url,headers=hdr)
urllib2.urlopen(url).read()
html = urllib2.urlopen(req).read()
soup=BeautifulSoup(html,"html5lib")
players = soup.find_all("td", {"data-title": "Navn"})
player_data = ""
saveFile = open('player_data.txt','w')
for item in players:
player_data = item.contents[0].encode("utf-8")
print player_data
saveFile.write (player_data)
saveFile.close()
나는이 형식의 데이터 라인을 얻을 '= 제목'난 그냥이 작동 얻을 수없는 것에서 IFIC 이름 ... 사전 :
잘 아, 미안 메신저 태그에서 title 속성을 얻을 의미 , 그리고 2 일 동안이 문제에 붙어 있었고, 나를 믿어, 나는 이것에 대한 수많은 질문을 읽었으며, stackoverflow와 비슷한 quostions에서도 시도했지만, 내 문제와 비슷한 또 다른 질문을 보지 못했다. . 원래 질문에 저에게 링크를 부탁드립니다, 감사합니다.) - 아마도 이것은 수년간의 파이썬 경험으로 극복하기가 쉽지만, t :) – BulletEyeDK