"유니 코드 (head.contents [3])"를 사용하여 태그의 내용을 가져 오려고하면 "Christensen Sk \ xf6ld ". 이스케이프 시퀀스를 문자열로 반환해야합니다. 어떻게 파이썬에서 그것을 할 수 있습니까?파이썬 문자열에서 유니 코드 이스케이프 시퀀스를 유니 코드 문자로 변환하는 방법
답변
파이썬은 일반 문자열로 이름을보고 가정하면, 먼저 유니 코드로 디코딩해야합니다 :
>>> name
'Christensen Sk\xf6ld'
>>> unicode(name, 'latin-1')
u'Christensen Sk\xf6ld'
이 달성의 또 다른 방법 :
>>> name.decode('latin-1')
u'Christensen Sk\xf6ld'
을 다음의 예를 참조하십시오
문자열 앞의 "u"에 유의하십시오. 당신이 인쇄하는 경우, 악센트 문자가 제대로 표시됩니다 :
>>> print name.decode('latin-1')
Christensen Sköld
BTW : 필요한 경우, 당신은 예를 들어,에 유니 코드를 설정하는 데 "인코딩"방법을 사용할 수 있습니다 UTF-8 문자열 : 유니 코드와 바이트 문자열을 감안할 때
>>> name.decode('latin-1').encode('utf-8')
'Christensen Sk\xc3\xb6ld'
나는 그것이 올바르게 작동하고 있다고 생각합니다. 기본적으로 파이썬은 모든 터미널이 유니 코드를 지원하지 않기 때문에 ASCII 인코딩으로 문자열을 표시합니다. 실제로 문자열을 인쇄하면 작동합니다.
>>> u'\xcfa'
u'\xcfa'
>>> print u'\xcfa'
Ïa
터미널에 문제가있는 경우 데이터베이스 (MySQL)에 저장하면 제대로 표시 되나요? – Vicky
네, 그래도되지만 DB의 데이터 정렬/문자 세트 인코딩을 처리해야합니다. – securecurve
는 b"\N{SNOWMAN}"
, b"\N{SNOWMAN}".decode('unicode-escape)
가 예상 유니 코드 문자열 u'\u2603'
를 생성합니다 이스케이프합니다.
- 1. 파이썬은 유니 코드 이스케이프 적용
- 2. 파이썬 유니 코드 : 유니 코드 문자열에 대해 테스트하는 방법
- 3. 이중 이스케이프 유니 코드 Javascript 문제
- 4. Lucene 유니 코드 문자로 검색
- 5. 파이썬 유니 코드 지원
- 6. 파이썬 스트립() 유니 코드 문자열?
- 7. 유니 코드 문자열 리터럴
- 8. C# : 유니 코드 문자를 해당 ASCII 문자로 변환하는 방법
- 9. 유니 코드 문자를 이스케이프 처리 된 ASCII로 변환하는 방법 #
- 10. 유니 코드를 ASCII로 변환하는 코드
- 11. 유니 코드 문자로 인식 할 수없는 이스케이프 문자열이있는 문제가 발생했습니다.
- 12. 파이썬 문자열에서 유니 코드 "구두점"을 제거하는 방법
- 13. 파이썬 유니 코드 문자열에서 악센트를 제거하는 가장 좋은 방법은 무엇입니까?
- 14. 표준 파이썬 라이브러리와 유니 코드
- 15. 파이썬 및 유니 코드 stderr
- 16. 파이썬 json로드 및 유니 코드
- 17. javascript - 유니 코드 문자열을 ascii로 변환하는 방법
- 18. char에서 유니 코드 값으로 변환하는 방법 #
- 19. QString을 LPCSTR (유니 코드)로 변환하는 방법
- 20. Perl에서 문자열을 유니 코드 문자열로 변환하는 방법
- 21. 유니 코드 창에서 비 유니 코드 WM_CHAR
- 22. NSString 유니 코드 디스플레이
- 23. 글리프 인덱스를 유니 코드 문자로 변환
- 24. 문자열을 유니 코드 문자로 변환하려면 어떻게해야합니까?
- 25. 유니 코드 문자로 다국어 지원. 약간의 혼란
- 26. 파이썬 이미지의 텍스트에 유니 코드 문제가 있습니다
- 27. 유니 코드 코드 포인트를 UTF-8로 변환하는 가장 간단한 방법
- 28. 파이썬 및 유니 코드 파일 구문 분석
- 29. Java 및 유니 코드
- 30. 관리되지 않는 유니 코드 문자열에서 SecureString 만들기
고마워. 그래서 그것을 데이터베이스에 저장해야 할 필요가 있다면 디코드하고 데이터베이스에 저장할 수 있습니까? – Vicky
아니요, Mark의 예를 다시 읽으십시오. (latin1, cp1252 등)에서 유니 코드로 데이터를 디코딩 한 후에는 (1) 데이터베이스가 지원하고 (2) 모든 유니 코드 문자를 유지하는 인코딩으로 유니 코드 문자열을 인코딩해야합니다. 일반적으로 UTF-8 . –