2013-06-12 3 views
2

this page에서 R로 시작하는 단어 (동사)를 추출하려고합니다. 그러나 다음 코드를 실행에 :BeautifulSoup를 사용하는 중에 오류가 발생했습니다.

UnicodeEncodeError: 'charmap' codec can't encode character u '\xa9' in position 57801: character maps to undefined

사람이 오류가 무엇이며 어떻게 해결하고 진행하는 걸 말해 주시겠습니까 :

from bs4 import BeautifulSoup 
import urllib2 
url = "http://www.usingenglish.com/reference/phrasal-verbs/r.html" 
content = urllib2.urlopen(url).read() 
soup = BeautifulSoup(content) 
print soup.prettify() 

오류 발생을 이런 식으로 뭔가를했다?

답변

7

을 전체 스택 트레이스 또는 적어도 어느 라인에서 가리키게하는지 훨씬 쉽게 나타납니다.

어쨌든, 문제는 마지막 줄에있는 것입니다. 변경 대상 :

print(soup.prettify().encode('utf-8')) 
+0

고맙습니다! 그것은 매력처럼 작동했습니다! 또 다른 질문 : 쉽게 공유 할 수 있도록 오류 (추적 기록)를 파일에 기록 할 수있는 방법이 있습니까? (다른 방법은 전체를 입력하는 것뿐입니다!) –

+0

@RakshithNayak ['logging'] (http://docs.python.org/2/library/logging.html)에 익숙해지는 것이 좋습니다. 신중하게 1 시간을 신중하게 탐험하고 나면 실제로 삶을 더 편하게 만듭니다. – kirelagin

관련 문제