사용자에게 뭔가를 출력해야 할 때 유니 코드와 인코딩을 UTF-8로 처리했다는 것을 알면서 파이썬 세계에 만족했습니다. 그런 다음 동료 중 한 명이 나를 this article으로 UTF-8로 보냈고 혼란스러워했습니다.유니 코드는 Python으로 - 단지 UTF-16입니까?
이 기사의 저자는 Python이 사용하는 유니 코드 표현 인 UCS-2가 UTF-16과 동의어임을 여러 번 나타냅니다. 그는 심지어 Python이 내부 문자열 표현을 위해 UTF-16을 사용한다고 직접 말합니다.
저자는 또한 Windows 애호가 및 개발자임을 인정하고 MS가 수년 동안 문자 인코딩을 처리 한 방식으로 인해 그 그룹이 가장 혼란스러워지기 때문에 아마도 그 자신의 혼란 일 수 있습니다. 나는 모른다 ...
누군가는 UTF-16 대 유니 코드의 상태를 파이썬으로 설명 할 수 있습니까? 그것들은 동의어입니까, 그렇지 않다면 어떤 의미입니까?
왜 파이썬의 _internal_ 문자열 표현에 관심이 있습니까? 이 사이트의 요점은 개발자가 작성한 모든 코드에서 UTF-8을 사용하도록 설득하는 것입니다. 파이썬 내부를 개발하지 않는 것입니까? –
UCS-2 및 UTF-16 *은 같지 않습니다 *. UCS-2는 모든 유니 코드 코드 포인트를 인코딩하지 않으므로 폐기되었습니다. –
@MattBall SO는 지식을 공유하고 (서로를 돕는) 개발자에 관한 것입니다. 이것은 저에게 흥미로운 것입니다. 이 질문을하는 데 더 이상의 이유가 필요합니까? – Endophage