2017-02-13 4 views
0

URL 목록을 읽은 다음 클래스에서 html을 출력하려고합니다. 그것은 작동하지만 목록의 마지막 URL에 대해서만 작동하며 이유를 파악할 수 없습니다. 시간 초과 등을 설정했지만 여전히 마지막 URL을 제외하고는 빈 응답 만 반환합니다. 다른 사람이 할 동안파일에서 파이썬 읽기 URL 만 마지막 URL 만 가져옵니다.

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 

from bs4 import BeautifulSoup 

import requests 
import time 

with open('/Users/usrname/Desktop/links.txt') as f: 
    for line in f: 
     print(line) 
     html_doc = requests.get(line, verify=False, timeout=2) 
     soup = BeautifulSoup(html_doc.text, 'html.parser') 
     #time.sleep(1.3) # seconds   
     print (soup.find_all("div", "location-content"))   

답변

3

파일의 마지막 행은 캐리지 리턴이없는 등 유효한 URL이 없습니다. 캐리지 리턴을 벗어야합니다. rstrip()

for line in f: 
    line = line.rstrip() 
+0

Perfecto .. 건배 – Kravitz

+0

여러분을 환영합니다! –

관련 문제