2011-11-28 4 views
6

파이썬에서 내가 만난 많은 문제들은 유니 코드에서 무언가가 없다는 것과 관련이 있습니다. 유니 코드를 사용하지 않을 이유가 있습니까? 나는 ASCII로 무엇인가를 번역 할 필요가 있다는 것을 이해하지만 그것은 규칙이 아닌 예외 인 것처럼 보인다.문자열 대신 유니 코드를 사용하지 않는 것이 좋은 이유가 있습니까?

파이썬 3은 모든 문자열에 유니 코드를 사용한다는 것을 알고 있습니다. 이것은 내 개발자 unicode() 내 모든 문자열을 개발자로 격려해야합니까?

답변

6

일반적으로 "아니오"라고 대답하면 stringunicode 이상 사용하는 것이 좋습니다. 또한 유니 코드 문자열을 만들기 위해 unicode()을 호출 할 필요가 없다는 것을 기억하십시오. 문자열 앞에 u"this is a unicode string"과 같은 소문자 u를 붙이면됩니다. 파이썬 2.X에서

+1

감사합니다. 지금부터 시작하겠습니다. –

4

:

  • str 객체는 기본적으로 바이트 단지 순서입니다.
  • unicode 개체는 문자의 시퀀스입니다. 당신이 문자 사용 unicode문자열을 원하는 경우

    • 이를 알고

    , 올바른 유형을 선택하기 쉽게해야합니다.

  • 으로 인코딩 된 문자열을 str으로 사용하려면 (다른 많은 언어에서는 byte[]을 사용하십시오).

파이썬 3.x에서 str 타입은 예상대로 캐릭터 문자열입니다. 일련의 바이트를 원할 경우 bytes을 사용할 수 있습니다.

+0

Python 2.6+는 바이트를 좀 더 변경 가능하게 만들고 싶다면 bytearrays도 가지고 있습니다. – kindall

관련 문제