유니 코드 포인트 문자 Ä
을 가져옵니다.
Python3 버전. encode ("unicode-escape")를 사용하여 이중 백 슬래시 대신 단일 백 슬래시를 얻는 방법은 무엇입니까?
>>> str="Ä"
>>> str.encode("unicode-escape")
b'\\xc4'
어떻게 내 출력으로 단일 백 슬래시 형식
b'\xc4'
대신
b'\\xc4'
를 얻으려면?
유니 코드 포인트 문자 Ä
을 가져옵니다.
Python3 버전. encode ("unicode-escape")를 사용하여 이중 백 슬래시 대신 단일 백 슬래시를 얻는 방법은 무엇입니까?
>>> str="Ä"
>>> str.encode("unicode-escape")
b'\\xc4'
어떻게 내 출력으로 단일 백 슬래시 형식
b'\xc4'
대신
b'\\xc4'
를 얻으려면?
원하는대로 나에게 명확한 것은 아니므로 몇 가지 옵션을 알려 드리겠습니다.
정수로 문자의 (유니 코드) 코드 포인트 받기 :
>>> ord('Ä')
196
디스플레이 진수 표기법으로 정수 :
>>> hex(ord('Ä'))
'0xc4'
또는 문자열 서식 :
>>> '{:X}'.format(ord('Ä'))
'C4'
을
그러나 백 슬래시에 대해 이야기하고 바이트 코드 b'\xc4'
을 보여줍니다. 이것은 Latin-1 인코딩 'Ä'
입니다 (256 미만의 유니 코드 코드 포인트를 포함한 모든 문자는 Latin-1로 인코딩 될 수 있으며 해당 바이트 값은 유니 코드 코드 포인트와 같습니다).
>>> 'Ä'.encode('latin-1')
b'\xc4'
이
그것은 당신이 즉,이 문자를 입력 할 수있는 방법으로 표시되는 길이 1 의 bytestring입니다. 백 슬래시 -x 및 두 자리 16 진수와 함께 이스케이프 시퀀스를 사용합니다.은 "유니 코드 - 탈출"코덱은 아니지만 str
로,이 네 ASCII 문자 (\
, x
, c
4
)을 생산하지만, bytes
객체 (str.encode()
때문에 반환 정의에 bytes
) 등. 는 STR에 백 슬래시를 얻으려면/문자 그대로 당신은 두 개의 백 슬래시를 입력해야하므로 repr
esentation 양식은 두 개의 백 슬래시 사용 바이트 :
>>> 'Ä'.encode('unicode-escape')
b'\\xc4'
은 "유니 코드 - 탈출"코덱은 매우 파이썬 별 및 I입니다 많은 응용 프로그램을 보지 마라. 어쩌면 파이썬 소스 코드의 조각을 파싱하거나 자신의 피클 프로토콜을 작성하고 싶을 수도 있습니다.