2011-03-05 2 views
0
soup = BeautifulSoup(html).findAll('div', 'thread') 
    for i in soup: 
    print i 

그게 내가에 갇혀지고있어 곳이기 때문에 코드 만이 참여할 수 있습니다.순회과 BeautifulSoup로

스프 목록을 반환, 내가 ''.join을 사용하려고() 리터럴 문자열이 있어야하고 작동하지 않습니다. 왜냐하면 예상되는 문자열이기 때문에 태그가 아닙니다. 나는 그것이 일종의 버그라고 생각한다.

반복하면 모든 목록이 쉼표없이 화면에 인쇄됩니다.

는하지만 내가 원하는 마지막 코드는 날 'NoneType'개체가 callabe되지 않고 있습니다 내가

soup = BeautifulSoup(html).findAll('div', 'thread') 
    for i in soup: 
    print BeautifulSoup(i)('a')['href'] 

처럼 많은 것들을 시도 DIV 카스 = "스레드"

내부 HREF 내용을 얻을 수 있습니다.

저는 많은 조합을 시도하고 있습니다.하지만 실제로 붙어서, 전혀 작동하지 않습니다. 나는 많은 실패한 시도 후에 무엇을 해야할지 모르겠다. 그것은 실망 스럽다. 이 모듈/클래스 (http://www.crummy.com/software/BeautifulSoup/documentation.html)에 대한 문서에서 살펴 본다
divs = BeautifulSoup(html).findAll('div','thread')
for div in divs:
print div.find('a').attr['href'] // may it be map(a.attrs)['href'], i dont remember now

+1

'a'주변의 괄호를 대괄호로 바꿉니다. 지금 작동합니까? –

답변

1

그것은해야 뭔가 - 두 번째 인수 findAll은 문자열이 아닌 json 객체입니다.

BeautifulSoup(html).findAll('div', { 'class': 'thread' }) 
관련 문제