긁어 :이다BeautifulSoup로 HTML 나는 웹 사이트에서 텍스트를 긁어하기 위해 노력하고있어, 지금까지 나는 다음과 같은 코드를 작성
import urllib, urllib2, cookielib, re, io, sys
from bs4 import BeautifulSoup
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
resp = opener.open('http://www.bancuri.net/formular_mail.aspx?ID=3181').read()
soup = BeautifulSoup(resp)
for tr in soup.find_all('p'):
tds = tr.find_all('justify')
for x in tds:
print x
내가 긁어 필요한 데이터를 :
Categoria: Bărbaţi şi femei
Bancul: O femeie către un bărbat la o petrecere:
- Dumneata tare semeni cu al treilea soţ al meu.
- Dar de cîte ori aţi fost căsătorită?
- De două ori pînă acum.
그러나 제대로 작동하지 않으며 다음과 같은 결과가 나타납니다.
C:\Users\admin\Desktop>bancuri.py
C:\Users\admin\Desktop>
어떤 문제일지도 모릅니다.
. 액세스하려면 사용자 이름과 암호가 필요합니다. – Joe
아니요, 액세스하려면 사용자 이름이나 비밀번호가 필요 없습니다! – kingcope
다른 사람들이 더 쉽게 나를 도와 줄 수 있도록 게시물을 편집하여 출력물을 추가하십시오. – Rubens