나는 많은 소스 (데이터베이스, 파일 등)의 데이터를 가져 오는 파이썬 스크립트를 가지고있다. 아마, 모든 문자열은 유니 코드,하지만 난 (repr()
에 의해 반환) 다음과 같은 주제에 어떤 변형지고 결국 무엇을 :파이썬에서 엉뚱한 인코딩 다루기
u'D\\xc3\\xa9cor'
u'D\xc3\xa9cor'
'D\\xc3\\xa9cor'
'D\xc3\xa9cor'
위의 문자열과 반환의 네을 할 수있는 신뢰할 수있는 방법이 있나요이 적절한 유니 코드 문자열? 내가 지금 생각할 수있는
u'D\xe9cor' # --> Décor
있는 유일한 방법은, replace()
을 eval()
사용하고, 깊은, 불타는 수치 씻어하지 않을 것이다.
더 이상한 인코딩 만 엉뚱한 프로그래머가 없습니다. –