는 내가 Django tutorial에서이 구절을 통해 발견 :유니 코드 대 Python/Django에서의 UTF-8 혼란?
장고 모델 유니 코드()를 호출하고 UTF-8 bytestring에 결과를 변환하는 기본 STR() 메소드가 있습니다. 이것은 유니 코드 (p)가 유니 코드 문자열을 반환하고 str (p)가 UTF-8로 인코딩 된 문자로 일반 문자열을 반환한다는 것을 의미합니다.
afaik 유니 코드가 특별한 표현이 아니기 때문에 혼란 스럽습니다. 파이썬에서 "유니 코드 문자열"은 무엇입니까? 그것은 UCS-2를 의미합니까? 인터넷 검색 결과는 this "Python Unicode Tutorial"으로 대담하게 나타납니다.
유니 코드는 세계 공통의 모든 문자 체계를 포괄하는 2 바이트 인코딩입니다.
틀린가요? 나는 문자 집합과 인코딩 문제로 여러 번 혼란 스러웠다. 그러나 여기서 내가 읽는 문서는 혼란 스럽다. 파이썬에서 나에게 "유니 코드 문자열"을 주었을 때 무슨 일이 벌어지고 있는지 아는 사람이 있습니까?
다른 사람이 선택한 "답변"이 선택된 경우에도 사람들이이 답변에 투표하십시오. – tzot
[부끄러움] 둘 다 정확합니다. 'len ('ΤΖΩΤΖΙΟΥ ') == 8'의 의미는 유니 코드 문자열이 실제로 무엇인지 정의합니다. – bobince
나는 동의하지 않는다; 질문을 읽고, "파이썬에서 유니 코드 문자열이란 무엇입니까?"라고 말합니다. 선택한 대답은 무작위로 문장의 메쉬처럼 보이지만 대답은 훨씬 더 중요해 보입니다. 그러나 이것은 더 이상 추구하지 않을 문제입니다. 건배 :) – tzot