2013-04-19 4 views
-1
from urllib import urlopen 
from bs4 import BeautifulSoup 
import re 

# Copy all of the content from the provided web page 
webpage = urlopen('http://stats.espncricinfo.com/indian-premier-league-2012/engine/records/averages/batting.html?id=6680;type=tournament').read() 

soup=BeautifulSoup(webpage); 

commentary=soup.find_all("tr", "data2"); 

for i in range(10): 

    for stat in commentary[i].stripped_strings: 
     print stat, 

    print "" 

이클립스에서이 Python 프로그램을 실행하고 있습니다. 네트워크 연결에서 프록시 항목을 변경했습니다. 그러나 나는 다음과 같이 IO 오류를 얻고있다 :웹 스크래핑 중 IO 오류

IOError: [Errno socket error] [Errno -2] Name or service not known

역 추적 (마지막으로 가장 최근의 전화) : 당신이 flakey 인터넷 연결이 같은

File "/home/sumanth/workspace/python/scraping.py", line 22, in webpage = urlopen(' http://stats.espncricinfo.com/indian-premier-league-2012/engine/records/averages/batting.html?id=6680;type=tournament ').read()

File "/usr/lib/python2.7/urllib.py", line 86, in urlopen return opener.open(url)

File "/usr/lib/python2.7/urllib.py", line 207, in open return getattr(self, name)(url)

File "/usr/lib/python2.7/urllib.py", line 344, in open_http h.endheaders(data)

File "/usr/lib/python2.7/httplib.py", line 958, in endheaders self._send_output(message_body)

File "/usr/lib/python2.7/httplib.py", line 818, in _send_output self.send(msg)

File "/usr/lib/python2.7/httplib.py", line 780, in send self.connect()

File "/usr/lib/python2.7/httplib.py", line 761, in connect self.timeout, self.source_address)

File "/usr/lib/python2.7/socket.py", line 571, in create_connection raise err

IOError: [Errno socket error] [Errno 110] Connection timed out

+0

스택 오버플로에 오신 것을 환영합니다. 질문을 명확하게하거나 추가 정보를 게시하려는 경우 질문을 편집 할 수 있습니다. 예를 들어, traceback을 주석 대신 질문에 추가하십시오. – tripleee

+0

@ sumumh : 나는 당신의 질문을 downvoted하지 않았고, 같은 것을 편집하는 형식을 만들었습니다. 투표가 실패한 이유는 정보가 부족한 문제 일 수 있습니다. –

답변

1

것 같습니다. "이름 또는 서비스를 알 수 없음"오류는 페이지에 대한 DNS 조회에 실패했음을 의미하며 "연결 시간 초과 오류"는 원격 서버에 연결할 수 없지만 DNS 조회가 성공했음을 의미합니다.

+0

예 ..하지만 이클립스의 프록시를 변경 한 후 시스템을 다시 시작할 때만 제대로 작동합니다. 이클립스 프록시를 변경 한 후 시스템을 다시 시작하지 못하게하는 해결책을 얻을 수 있습니까? – smnth90