2010-07-31 2 views
1

그래서 양식이있는 html 페이지와 제품 행이있는 양식 안에 테이블이 있습니다.BeautifulSoup을 사용하여 테이블 셀에서 이미지 src를 가져 오는 데 도움이됩니다.

이제 테이블 행을 순환하는 지점에 도달했으며 각 루프마다 모든 테이블 셀을 가져 왔습니다.

for tr in t.findAll('tr'): 
    td = tr.findAll('td') 

이제 첫 번째 td에서 이미지 URL을 가져 오려고합니다.

<tr> 
    <td ...> 
    <a href ... > 
     <img ... src="asdf/asdf.jpg" .. > 
    </a> 
    </td> 

    ... 
</tr> 

가 어떻게 이렇게 가겠어요 : 같은

HTML을 본다? 나는 정규식의 관점에서 계속 생각하고있다.

내가 시도 :

td[0].a.image.src하지만 더 속성 'SRC'를 말한다 없기 때문에 그것은 작동하지 않았다.

답변

6

사용

td[0].a.img['src'] 

나는 문제 img에 대한 image의 사용은 단지 전사 오류였다 상상하지만, 중요한 점은 BeautifulSoup로에, 태그의 HTML에 액세스하기 위해 인덱싱을 사용하는 속성이다 위의 코드 예제에서 ['src']과 같은 점 표기법을 사용하면 도트 구문이 아니라 도트 구문 표기법이 실제로 트리 아래로 진행됩니다 (위에서 두 도트 각각 aimg).

관련 문제