2017-03-27 2 views
0

나는 The Guardian을 포함한 다양한 소스의 RSS 피드를 사용하는 뉴스 큐 레이션 서비스를 구축하고 있습니다.웹 스크래핑 : 이미지는 Facebook에 공유되지만 내 앱에는 공유되지 않습니다. 오류 401 서명을 찾을 수 없습니다.

가디언 기사에서 이미지를 가져 오려고하면 다음과 같이 표시됩니다. 오류 401 서명을 찾을 수 없습니다. 오류.

그러나 Facebook 등으로 기사를 공유하면 이미지가 피드에 표시됩니다. https://i.guim.co.uk/img/media/dd92773d05e7da9adcff7c007390a746930c2f71/0_0_2509_1505/master/2509.jpg?w=1200&h=630&q=55&auto=format&usm=12&fit=crop&crop=faces%2Centropy&bm=normal&ba=bottom%2Cleft&blend64=aHR0cHM6Ly91cGxvYWRzLmd1aW0uY28udWsvMjAxNi8wNi8wNy9vdmVybGF5LWxvZ28tMTIwMC05MF9vcHQucG5n&s=bb057e1ec495b0ec4eb75a892b6a190c

이 페이지에서 : https://www.theguardian.com/global-development/2016/mar/22/world-water-day-quiz-are-you-a-fount-of-wisdom

페이스 북이 할 수처럼 이미지를 사용하는 방법이 있습니까

예를 들어,이 전류 글에 이미지 링크는?

감사합니다.

답변

0

시스템에 로그인하거나 인증하지 않고 일부 인트라넷 리소스를 사용하려고하기 때문에 발생하는 401 오류가 원인 일 수 있습니다.

다음 코드를 사용하면 더 작은 버전의 그림을 가져올 수 있습니다. 그런 다음

from bs4 import BeautifulSoup 
import requests 

url = 'https://www.theguardian.com/global-development/2016/mar/22/world-water-day-quiz-are-you-a-fount-of-wisdom' 
html_source = requests.get(url).text 
#print(html_source) 

soup = BeautifulSoup(source, 'html.parser') 

img = soup.find_all('img', {'class':'maxed responsive-img'}) 

할 수 있습니다 print 당신 결과 : 그것은


코드를 당신이 제공하는 페이지의 HTML 소스를 읽고 특정 요구 사항이있는 IMG를 검색합니다

첫 번째 img :

print(img[0]['src']) 

출력 :

https://i.guim.co.uk/img/media/dd92773d05e7da9adcff7c007390a746930c2f71/0_0_2509_1505/master/2509.jpg?w=300&q=55&auto=format&usm=12&fit=max&s=ba3a4698fe5fce056174eff9ff3863d6 

모든 IMG 결과 :

for i in img: 
    print(i['src']) 

출력 :

https://i.guim.co.uk/img/media/dd92773d05e7da9adcff7c007390a746930c2f71/0_0_2509_1505/master/2509.jpg?w=300&q=55&auto=format&usm=12&fit=max&s=ba3a4698fe5fce056174eff9ff3863d6 
https://i.guim.co.uk/img/media/6ef58c034b1e86f3424db4258e398c88bb3a3fb4/0_0_5200_3121/2000.jpg?w=300&q=55&auto=format&usm=12&fit=max&s=ea8370295d1e2d193136fd221263c8b8 
https://i.guim.co.uk/img/media/e1c2b1336979a752a68c3c554611bc28aa0a4baa/0_290_4324_2594/2000.jpg?w=300&q=55&auto=format&usm=12&fit=max&s=eef138cefe66834919c3544826a3e468 
https://i.guim.co.uk/img/media/37df4e7b52dfd554d431f7d439cdd1a137789fa4/0_0_4256_2553/2000.jpg?w=300&q=55&auto=format&usm=12&fit=max&s=9e461f6739325cf3524a1228f5f7e60b 
+0

감사합니다! 당신에게 감사 드리며, '최대 반응 형 이미지'클래스를 가진 이미지가 저에게 효과가있는 유일한 버전이라는 것을 알게되었습니다. 도와 줘서 고마워! :) – pedrogrande

관련 문제