다음 Python 코드는 BeautifulStoneSoup를 사용하여 Tolkien의 "The Children of Húrin"에 대한 LibraryThing API 정보를 가져옵니다.Python을 사용하여 HTML 엔터티 디코딩
import urllib2
from BeautifulSoup import BeautifulStoneSoup
URL = ("http://www.librarything.com/services/rest/1.0/"
"?method=librarything.ck.getwork&id=1907912"
"&apikey=2a2e596b887f554db2bbbf3b07ff812a")
soup = BeautifulStoneSoup(urllib2.urlopen(URL),
convertEntities=BeautifulStoneSoup.ALL_ENTITIES)
title_field = soup.find('field', attrs={'name': 'canonicaltitle'})
print title_field.find('fact').string
불행히도 'Húrin'대신 'Hrinin'을 인쇄합니다. 이것은 분명히 인코딩 문제이지만 예상되는 출력을 얻으려면 내가해야 할 일을 해결할 수 없습니다. 도움말 크게 감사하겠습니다.
그래, 그게 나을 것 같아. 나는 LibraryThing에 그것을 분류하는 것에 대해 연락했다. 감사. :) –