"\ xaf", "\ xbe"와 같은 문자가 포함 된 텍스트가 있는데, 이는 this question에서 알 수 있듯이 ASCII로 인코딩 된 문자입니다.파이썬에서 xXY 인코딩 된 문자를 UTF-8로 변환하는 방법은 무엇입니까?
파이썬에서 UTF-8로 변환하고 싶습니다. 보통 string.encode("utf-8")
은 UnicodeDecodeError
입니다. 예를 들어 codecs
표준 라이브러리와 같은 더 좋은 방법이 있습니까?
샘플이 포함되지 않는'\ xaf' 또는 같은. 그런 성격의 표본이 있습니까? – dkarp
샘플 데이터 *는 * 유효한 UTF-8입니다. "레코드 분리 기호"및 "단위 분리 기호"제어 문자가있는 경우. – dan04
'enca' (http://linux.die.net/man/1/enca)에 따르면, UTF-8은 "비 텍스트 데이터로 둘러싸여/혼합되어 있습니다". –