어떻게 파이썬을 사용하여 HTML 이스케이프 문자를 대체 할 수 있습니까?

가능한 중복 :
Decode HTML entities in Python string?어떻게 파이썬을 사용하여 HTML 이스케이프 문자를 대체 할 수 있습니까?

나는 HTML 이스케이프 문자의 전체 문자열이 같은 ", ” 및 —있다.

모든 파이썬 라이브러리는 이러한 모든 이스케이프 문자를 각각의 실제 문자로 대체 할 수있는 확실한 방법을 제공합니까?

는 예를 들어, 나는 모든 "들의 "로 대체 할

출처

2012-07-10 dangerChihuahua007

[하려면 string.replace (http://docs.python.org/library/string.html#string.replace) –

사용 아름다운 수프 : HTTP : // LXML .de/elementsoup.html – sateesh

당신이를 사용하려면 :.

from HTMLParser import HTMLParser 
parser = HTMLParser() 
html_decoded_string = parser.unescape(html_encoded_string)

나는 또한

from BeautifulSoup import BeautifulSoup 
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES)

BeautifulSoup로

에 대한 사랑을 많이보고 있어요

다음 기존 질문 중 중복 :

Decode HTML entities in Python string?

Decoding HTML entities with Python

Decoding HTML Entities With Python

출처

2012-07-10 03:04:14

복제본이라는 것을 알고 계시다면 rep (응답자 제외) 대신 응답 하시겠습니까? – kapa

사람들이 자신의 질문에 대한 기존 답변, 특히이 경우에는 정확한 복제본이 많은 시간을 찾기 위해 시간을 들이지 않아도 귀찮습니다. 그러나 나는 때때로 지역 사회의 과격 경고를 느낀다. 질문을 오해하고 실제로 중복 된 것이 아니라면 어떨까요? 질문에 대답하면 다른 방향으로 질문과 대답을하는 의미있는 대화 나 대화가 시작됩니다. 또한 그것에 관한 명성에 관한 것이 아니라 일단 질문이 닫히거나 그것에 관련된 평판이 무효화 될 수 있습니다 ... –

나는 StackOverflow에서 일반적으로 받아 들여지는 행동 규범에 대해 경고하려고했습니다. 조금 신경이 쓰이는 것 같으면, 이것에 관한 메타 질문을 찾아 볼 것입니다.하지만 관심이 있다면 직접 찾아 볼 수있을 것 같습니다. 나는 이것에 대해 논쟁에 빠지기를 원하지 않는다, 나는 단지 메신저 였고, 당신이 원하는대로해라. :) – kapa

어떻게 파이썬을 사용하여 HTML 이스케이프 문자를 대체 할 수 있습니까?

답변

관련 문제