2017-12-29 6 views

답변

0

원하는대로 나에게 명확한 것은 아니므로 몇 가지 옵션을 알려 드리겠습니다.

정수로 문자의 (유니 코드) 코드 포인트 받기 :

>>> ord('Ä') 
196 

디스플레이 진수 표기법으로 정수 :

>>> hex(ord('Ä')) 
'0xc4' 

또는 문자열 서식 :

>>> '{:X}'.format(ord('Ä')) 
'C4' 

그러나 백 슬래시에 대해 이야기하고 바이트 코드 b'\xc4'을 보여줍니다. 이것은 Latin-1 인코딩 'Ä'입니다 (256 미만의 유니 코드 코드 포인트를 포함한 모든 문자는 Latin-1로 인코딩 될 수 있으며 해당 바이트 값은 유니 코드 코드 포인트와 같습니다).

>>> 'Ä'.encode('latin-1') 
b'\xc4' 

그것은 당신이 즉,이 문자를 입력 할 수있는 방법으로 표시되는 길이 1 의 bytestring입니다. 백 슬래시 -x 및 두 자리 16 진수와 함께 이스케이프 시퀀스를 사용합니다.

은 "유니 코드 - 탈출"코덱은 아니지만 str로,이 네 ASCII 문자 (\, x, c4)을 생산하지만, bytes 객체 (str.encode() 때문에 반환 정의에 bytes) 등. 는 STR에 백 슬래시를 얻으려면/문자 그대로 당신은 두 개의 백 슬래시를 입력해야하므로 repr esentation 양식은 두 개의 백 슬래시 사용 바이트 :

>>> 'Ä'.encode('unicode-escape') 
b'\\xc4' 

은 "유니 코드 - 탈출"코덱은 매우 파이썬 별 및 I입니다 많은 응용 프로그램을 보지 마라. 어쩌면 파이썬 소스 코드의 조각을 파싱하거나 자신의 피클 프로토콜을 작성하고 싶을 수도 있습니다.

관련 문제