2012-07-10 4 views
6

가능한 중복 :
Decode HTML entities in Python string?어떻게 파이썬을 사용하여 HTML 이스케이프 문자를 대체 할 수 있습니까?

나는 HTML 이스케이프 문자의 전체 문자열이 같은 ", ”—있다.

모든 파이썬 라이브러리는 이러한 모든 이스케이프 문자를 각각의 실제 문자로 대체 할 수있는 확실한 방법을 제공합니까?

는 예를 들어, 나는 모든 "들의 "로 대체 할

+0

[하려면 string.replace (http://docs.python.org/library/string.html#string.replace) –

+0

사용 아름다운 수프 : HTTP : // LXML .de/elementsoup.html – sateesh

답변

14

당신이를 사용하려면 :.

from HTMLParser import HTMLParser 
parser = HTMLParser() 
html_decoded_string = parser.unescape(html_encoded_string) 

나는 또한

from BeautifulSoup import BeautifulSoup 
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES) 
BeautifulSoup로

에 대한 사랑을 많이보고 있어요

다음 기존 질문 중 중복 :

Decode HTML entities in Python string?

Decoding HTML entities with Python

Decoding HTML Entities With Python

+1

복제본이라는 것을 알고 계시다면 rep (응답자 제외) 대신 응답 하시겠습니까? – kapa

+1

사람들이 자신의 질문에 대한 기존 답변, 특히이 경우에는 정확한 복제본이 많은 시간을 찾기 위해 시간을 들이지 않아도 귀찮습니다. 그러나 나는 때때로 지역 사회의 과격 경고를 느낀다. 질문을 오해하고 실제로 중복 된 것이 아니라면 어떨까요? 질문에 대답하면 다른 방향으로 질문과 대답을하는 의미있는 대화 나 대화가 시작됩니다. 또한 그것에 관한 명성에 관한 것이 아니라 일단 질문이 닫히거나 그것에 관련된 평판이 무효화 될 수 있습니다 ... –

+1

나는 StackOverflow에서 일반적으로 받아 들여지는 행동 규범에 대해 경고하려고했습니다. 조금 신경이 쓰이는 것 같으면, 이것에 관한 메타 질문을 찾아 볼 것입니다.하지만 관심이 있다면 직접 찾아 볼 수있을 것 같습니다. 나는 이것에 대해 논쟁에 빠지기를 원하지 않는다, 나는 단지 메신저 였고, 당신이 원하는대로해라. :) – kapa

관련 문제