from urllib import urlopen
from bs4 import BeautifulSoup
import re
# Copy all of the content from the provided web page
webpage = urlopen('http://stats.espncricinfo.com/indian-premier-league-2012/engine/records/averages/batting.html?id=6680;type=tournament').read()
soup=BeautifulSoup(webpage);
commentary=soup.find_all("tr", "data2");
for i in range(10):
for stat in commentary[i].stripped_strings:
print stat,
print ""
이클립스에서이 Python 프로그램을 실행하고 있습니다. 네트워크 연결에서 프록시 항목을 변경했습니다. 그러나 나는 다음과 같이 IO 오류를 얻고있다 :웹 스크래핑 중 IO 오류
IOError: [Errno socket error] [Errno -2] Name or service not known
역 추적 (마지막으로 가장 최근의 전화) : 당신이 flakey 인터넷 연결이 같은
File "/home/sumanth/workspace/python/scraping.py", line 22, in webpage = urlopen(' http://stats.espncricinfo.com/indian-premier-league-2012/engine/records/averages/batting.html?id=6680;type=tournament ').read()
File "/usr/lib/python2.7/urllib.py", line 86, in urlopen return opener.open(url)
File "/usr/lib/python2.7/urllib.py", line 207, in open return getattr(self, name)(url)
File "/usr/lib/python2.7/urllib.py", line 344, in open_http h.endheaders(data)
File "/usr/lib/python2.7/httplib.py", line 958, in endheaders self._send_output(message_body)
File "/usr/lib/python2.7/httplib.py", line 818, in _send_output self.send(msg)
File "/usr/lib/python2.7/httplib.py", line 780, in send self.connect()
File "/usr/lib/python2.7/httplib.py", line 761, in connect self.timeout, self.source_address)
File "/usr/lib/python2.7/socket.py", line 571, in create_connection raise err
IOError: [Errno socket error] [Errno 110] Connection timed out
스택 오버플로에 오신 것을 환영합니다. 질문을 명확하게하거나 추가 정보를 게시하려는 경우 질문을 편집 할 수 있습니다. 예를 들어, traceback을 주석 대신 질문에 추가하십시오. – tripleee
@ sumumh : 나는 당신의 질문을 downvoted하지 않았고, 같은 것을 편집하는 형식을 만들었습니다. 투표가 실패한 이유는 정보가 부족한 문제 일 수 있습니다. –