나는 혼란 스럽습니다! 아무도 문제가 어디 있는지 말해 줄 수 있니? 이 코드는 제대로 작동하는 데 사용되었지만 어제부터 아무 것도 반환하지 않았습니다. 나는 그것에 어떤 변화도 만들지 않았다 !!! 아무도 어떤 생각을 가지고 있니 ???urllib2는 파이썬에서 아무것도 반환하지 않습니다
import re
from re import sub
import time
import cookielib
from cookielib import CookieJar
import urllib2
from urllib2 import urlopen
import difflib
import requests
def twitParser():
try:
cj = CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
res=opener.open('https://twitter.com/haberturk')
html=res.read()
splitSource=re.findall(r'<p class="js-tweet-text tweet-text">(.*?)</p>',html)
print len(splitSource)
for item in splitSource:
aTweet = re.sub(r'<.*?>','',item)
print aTweet
except Exception, e:
print str(e)
print 'ERROR IN MAIN TRY'
twitParser()
이 정규 표현식에와 HTML을 구문 분석하지 마십시오 꽤 좋은 일 . http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags를 참조하십시오 (또한 Twitter에는 API가 있습니다. 스크린 스크럽하지 마십시오). – geoffspear
또한 탭을 혼합합니다. 큰 nono이고 버그를 일으킬 수있는 파이썬 들여 쓰기 공간. –
이 원인 일 수 있습니다 ???? 어디에????? 덕분에 – Jeren