2014-12-05 5 views
0

파이썬이 유니 코드를 다루는 방법에 대한 여러 가지 질문과 블로그 게시물을 읽었지만 여전히 약간 혼란 스럽습니다. 나는 치료를 통해 근근이 살아가고 있었고 웹 페이지에서 이것을 얻었다 : u'Isla de Se\xf1orita'. u'Isla de Señorita'이어야합니다. 나는 무엇인가를 할 수 있다는 것을 안다.파이썬 유니 코드 : ñ를 되돌릴 수 있습니까?

>>> u"ñ" 
u'\xf1' 
>>> u"ñ".encode("utf-8") 
'\xc3\xb1' 

그러나 나는 이것을 어떻게해야만 할까? u"ñ"을이 바이트에서 다시 가져올 수 있습니까? 난 그냥 ñ - 장고 모델의 필드에 저장할 수 있도록 싶습니다. 감사.

+0

파이썬은 여기서 도움이 되고자하며 ASCII 친화적 인 디버그 출력을 생성합니다. ñ 유니 코드의 U + 00F1이므로 파이썬은 ASCII 이외의 것을 처리 할 수없는 터미널이나 편집기에 복사하여 붙여 넣을 때도 중단되지 않는 방식으로 값을 나타내는'\ xf1'을 표시합니다. –

답변

0

ñ가 아직 있습니다. 그것은 다르게 인코딩됩니다. 파이썬 인터프리터에서이 작업을 확인하십시오.

>>> print '\xc3\xb1' 
ñ 

아마도 "get it back"으로 무엇을 의미하는지 명확하지 않습니까?

+0

동일한 코드 행을 입력하면 '├▒'가 표시됩니다. 그러나'print u 'ñ''가 표시되면 'ñ'가됩니다. 왜 그런가요? 하지만 어쨌든, 나는 그것을 인쇄 해 보지 못했습니다. _ <, 그래서 나는 지금 무슨 일이 일어나고 있는지 볼 수 있습니다. 나는 내 실수가 아마 다른 것과 관련이 있다고 생각한다. – pyramidface

+0

@pyramidface : 터미널이나 콘솔에 UTF-8을 쓰는 것은 해당 터미널이나 콘솔이 실제로 UTF-8을 처리하도록 구성된 경우에만 작동합니다. 너는 그렇지 않아. 나는 당신의 사본으로 귀하의 것을 폐쇄 한 게시물을보십시오. –

+0

@MartijnPieters 아, 알겠습니다. 정리 해줘서 고마워. – pyramidface

관련 문제