페이지의 모든 img
태그를 검색하고 특정 너비의 그림 만 잡고 싶을 때 BeautifulSoup을 사용하여 구문 분석 스크립트를 작성합니다.HTML 구문 분석의 태그
여기에 태그의 예 :
<img
alt=""
src="//upload.wikimedia.org/wikipedia/en/thumb/a/a9/Example.jpg/111px-Example.jpg"
width="111"
height="120"
/>
문제는 모든 img
태그가 width
속성을 가지고있다. width
속성이있는 img
태그에만 액세스하고 싶습니다.
images= soup.findAll("img")
listimages= []
for img in images:
if img['width']!==None:
listimages.append(img)
이 작동하지 않습니다
은 지금까지 나는의 라인을 따라 뭔가가있다. width
속성이없는 경우 NoneType
이 표시되지 않는 것으로 보입니다. 그럼 None
이 아니라면 뭐라 구요? 위의 링크에서
soup.findAll("img", width=True)
:
,'위의 코드가 있어야한다에 ==''='구문 오류가 발생하지 않도록!. –
장래에리스트 comprehension으로 해결할 수없는 비슷한 문제가 생기면'img.get ('width')'를 시도해보십시오. 그러한 attr가 없으면 예상대로 None을 반환합니다. – OregonTrail