2010-01-30 5 views
3

Beautifulsoup을 사용하여 RSS/Podcast 피드를 구문 분석하려고하는데 'pubDate'필드를 구문 분석 할 수없는 것 외에는 모든 것이 잘 작동합니다.pubDate Beautifulsoup/Python으로 이상한 내용을 분석하는 RSS

data = urllib2.urlopen("http://www.democracynow.org/podcast.xml") 
dom = BeautifulStoneSoup(data, fromEncoding='utf-8') 
items = dom.findAll('item'); 

for item in items: 
    title = item.find('title').string.strip() 
    pubDate = item.find('pubDate').string.strip() 

제목은 잘 해석됩니다 있지만 pubDate의을 얻을 때, 그것은 말한다 :

역 추적 (가장 최근 통화 최종) : 파일 "", 2 호선, AttributeError에서 'NoneType'객체를 '문자열'이 없습니다.

그러나 XML 파일의 복사본을 다운로드하고 'pubDate'의 이름을 다른 것으로 변경 한 다음 다시 구문 분석하면 작동하는 것으로 보입니다. pubDate는 파이썬에서 예약 된 변수인가?

감사합니다,

g 그것은 item.find('pubdate').string.strip() 작동

답변

3

. feedparser을 사용하지 않는 이유는 무엇입니까?

+1

감사합니다. 소문자로 변경하면 트릭을 수행합니다. 왜 그런가? 나는 확실히 feedparser를 체크 아웃 할 것이다. beautifulsoup보다 훨씬 쉬워 보입니다. – givp

관련 문제