3
Beautifulsoup을 사용하여 RSS/Podcast 피드를 구문 분석하려고하는데 'pubDate'필드를 구문 분석 할 수없는 것 외에는 모든 것이 잘 작동합니다.pubDate Beautifulsoup/Python으로 이상한 내용을 분석하는 RSS
data = urllib2.urlopen("http://www.democracynow.org/podcast.xml")
dom = BeautifulStoneSoup(data, fromEncoding='utf-8')
items = dom.findAll('item');
for item in items:
title = item.find('title').string.strip()
pubDate = item.find('pubDate').string.strip()
제목은 잘 해석됩니다 있지만 pubDate의을 얻을 때, 그것은 말한다 :
역 추적 (가장 최근 통화 최종) : 파일 "", 2 호선, AttributeError에서 'NoneType'객체를 '문자열'이 없습니다.
그러나 XML 파일의 복사본을 다운로드하고 'pubDate'의 이름을 다른 것으로 변경 한 다음 다시 구문 분석하면 작동하는 것으로 보입니다. pubDate는 파이썬에서 예약 된 변수인가?
감사합니다,
g 그것은 item.find('pubdate').string.strip()
작동
감사합니다. 소문자로 변경하면 트릭을 수행합니다. 왜 그런가? 나는 확실히 feedparser를 체크 아웃 할 것이다. beautifulsoup보다 훨씬 쉬워 보입니다. – givp