2014-03-28 2 views
0

나는 아름다운 수프를 사용하여 기사에서 이미지를 긁어 내려고합니다. 작동하는 것 같지만 이미지를 열 수 없습니다. 바탕 화면에서 이미지에 액세스하려고 할 때마다 파일 형식 오류가 발생합니다. 어떤 통찰력?아름다운 수프를 사용하여 이미지 긁기

답변

2

모든 이미지의 데이터 시작 부분에 줄 바꿈과 텍스트가 추가되어 본질적으로 손상됩니다.

또한 모든 이미지를 동일한 파일에 쓰고 다시 손상시킵니다.

파일을 루프에 기록하는 논리를 넣고 이미지에 추가 데이터를 추가하지 않아도됩니다.

# Scrape article main img 
links = soup.find('figure').find_all('img', src=True) 
for link in links: 
    timestamp = time.asctime() 
    txt = open('%s.jpg' % timestamp, "wb") 
    link = link["src"].split("src=")[-1] 
    download_img = urllib2.urlopen(link) 
    txt.write(download_img.read()) 

    txt.close() 
관련 문제