2011-02-10 2 views

답변

17

CP1252로 디코딩 된 UTF-8로 인코딩 된 라틴어 -1로 인코딩 된 UTF-8입니다.

>>> u'’'.encode('cp1252').decode('utf8').encode('latin1').decode('utf8') 
u'\u2019' 

진지하게 ... 누가 이럴까요?

+0

나는 그것이 * 트리플 * 코드 버그라고 생각하는만큼 멀리까지왔다. :) – hobbs

+6

어떻게 그걸 알아 냈나요? –

+1

또한, 분명히 * 아포스트로피가되어야하는 것 대신에 인쇄상의 올바른 인용 부호가 있습니다. – hobbs

관련 문제