2016-11-05 2 views
3

에 문자열로 바이트 : '\udcd0\udca0\udcd0\udcbe\udcd1\udc81\udcd0\udcbd\udcd0\udcb5\udcd1\udc84\udcd1\udc82\udcd1\udc8c'디코딩 내가 바이트의 행을 가지고 파이썬

내가 할 경우 :

b'\udcd0\udca0\udcd0\udcbe\udcd1'.decode("utf8"), 

내가받을 :

'\\udcd0\\udca0\\udcd0\\udcbe\\udcd1' 

나는 그것을 해독하지 못할 때문에 내가 어떻게 인코딩되었는지는 모르겠다. 적어도, 내가 볼 수있는 심볼은 \x23과 비슷하기 때문에 utf-8이 아니라는 것을 알 수 있습니다. 어떻게하면 디코더를 발견하고 디코딩 할 수 있습니까?

P. 러시아어 기호가 표시됩니다.

+0

http://stackoverflow.com/questions/436220/python-is-there-a-way-to-determine-the-encoding-of-text-file – Jakub

+0

@Jakub 대단히 감사합니다. 그러나 어떤 이유로 , 나는 추천 된 라이브러리를 설치할 수 없다. 다른 방법이 있습니까? –

답변

0

이 방법으로 문자열을 인쇄 할 수 있지만 결과는 모두 "잘못된 문자"입니다. Charbase.com에 따르면

>>> string = u'\udcd0\udca0\udcd0\udcbe\udcd1\udc81\udcd0\udcbd\udcd0\udcb5\udcd1\udc84\udcd1\udc82\udcd1\udc8c' 
>>> print string 
���������������� 

, 당신의 첫 번째 문자는 (u는 '\ udcd0') 잘못된 문자입니다. 그래서 출력이 맞을 수도 있습니다.

+0

우. 고마워. –

관련 문제