2017-10-15 3 views
2

파이썬에서이 문자열을 디코딩하는 방법은 무엇입니까?파이썬에서 HTML 문자열 디코드

title = 'Fast & Furious 6' 

는 얻을 :

Fast & Furious 6 

감사합니다!

+0

XML로 인코딩 된 HTML이 아닙니다. – Dijkgraaf

답변

1

이 코드를 사용하면 ascii rappresentation에서 char 기호를 얻을 수 있습니다.

title = 'Fast & Furious 6' 
title = title[:-1] 
substring=[x.strip() for x in title.split(';')] 
titleFinal = '' 

for ch in substring: 
    newstr = ch.replace("&#", "") 
    titleFinal+=chr(int(newstr)) 

print(titleFinal) 
+0

잘 작동합니다 :) 감사합니다 !!! –

+0

완벽, 오신 것을 환영합니다;) @CharlieSpecter – Daniele

0

그냥 사용하는 내장 html 모듈 : 당신의 문자열로

import html 
decoded_title = html.unescape(title)) 

HTML 안전 시퀀스 (숫자 참조)로 구성되어 있습니다.