2013-05-21 6 views
1

나는 BeautifulSoup로 간단한 예제를 작업하고 있었지만 이상한 재 작업을하고있었습니다. 내가 얻을 인쇄 할 때간단한 예 BeautifulSoup Python

soup = BeautifulSoup(page) 
print soup.prettify() 
stuff = soup.findAll('td', attrs={'class' : 'prodSpecAtribtue'}) 
print stuff 

:

여기 내 코드입니다

[] 

내가 화면에 수프를 인쇄 할 때 내가 적절한 데이터를 가지고 있기 때문에, 무슨 일이 일어나고 있는지 확실하지.

soup.findAll('td', attrs={'class': 'prodSpecAtribute'}) 

잘 작동 : 기본적으로 나는 클래스 prodSpecAtribtue

+0

아니요, 당신은'[]'또는 일치하는 목록을 얻을 것입니다. 당신은 ** {**}을 얻지 못할 것입니다. –

+0

죄송합니다. 제공 : { –

+1

이 결과가 계속 나타나는 샘플 HTML 코드 조각을 보여줄 수 있습니까? –

답변

1

에서 태그 <td>에서 발견의 값을 검색하고 당신은 클래스 이름의 철자. 즉, prodSpecAtribute, 이 아닌prodSpecAtribtue입니다. 여전히 철자가 틀리지 만 약간은 덜합니다.

+0

와우, 감사합니다 ... 온라인으로 한 시간 동안 검색 .. –

+0

효율적인 방법을 알고 계십니까? BeautifulSoup을 사용하여 및 형식의 데이터를 추출합니다. 나는 정규 표현식이 가장 간단한 해결책이라고 생각했다. –

+0

@JamesHallen : colspan 속성을 사용하여'td'를 모두 선택하십시오 :'.findAll ('td', colspan = True)', 값 4 * 또는 * 5를 가진 colspan 속성으로 모든'td'를 선택하십시오 :'.findAll ('td', colspan = [ '4', '5'])' –

관련 문제