2013-09-23 2 views
0

img 태그가 특정 id 인 것을 찾으려고합니다.
이 요소가 있지만 BeautifulSoup이 (가) 발견되지 않습니다.
내 코드는 다음과 같습니다BeautifulSoup가 존재하는 동안 일부 요소를 찾지 못했습니다.

pic=urllib2.urlopen("http://www.imdb.com/media/rm2826217216/nm0334441?ref_=nmmi_mi_all_sf_1") 
    pichtml=pic.read() 
    picsoup=BeautifulSoup(pichtml) 
    picurl=picsoup.find_all("img",{"id":"primary-img"}) 

내가 페이지에 이미지가 많이 있기는하지만 picsoup.find_all("img") 만 한 이미지를 발견 할 때!
무엇이 문제입니까?

+0

당신의 코드는 하나 개의 이미지를 반환합니다. 귀하의 코드/질문을 수정해야합니까? – TerryA

+0

'find_all'을 사용하지 않고 여전히 하나의 이미지 만 반환해야하는'id'를 제공하고 있습니까? –

+0

@Haidro :'picsoup.find'에 대해'None'을 리턴합니다. – RYN

답변

3

나는 전에이 문제에 직면 해 있으며, 기본 HTML 파서와 다른 HTML 파서를 지정하여 해결할 수있다. 정확한 이유를 모르겠지만 그럴 것 같아요. differences in the way each parser treats html

그래서 파서를 지정하면 문제를 해결할 수 있습니다. 당신이 댓글을 달았대로 soup.find` 아니라`soup.find_all``사용하기 때문에

picsoup=BeautifulSoup(pichtml, 'html.parser') 
관련 문제