저는 파이썬 초보자이고 utf-8 문제가 있습니다.파이썬에서 utf-8 특수 문자를 검색하고 바꾸는 방법은 무엇입니까?
필자는 utf-8 문자열을 가지고 있으며 모든 독일어 움라우트를 ASCII 대체 문자로 대체하고자합니다 (독일어에서는 u-움라우트 'ü'가 'ue'로 다시 쓰일 수 있습니다).
U-움라우트는 유니 코드 코드 포인트 (252)를 가지고, 그래서 나는이 시도 :
>>> str = unichr(252) + 'ber'
>>> print repr(str)
u'\xfcber'
>>> print repr(str).replace(unichr(252), 'ue')
u'\xfcber'
내가 마지막 문자열
u'ueber'
될 것으로 예상.
은 내가 궁극적으로하고 싶은 것은 'UE'가있는 파일의 모든 U-움라우트를 대체 할 수 있습니다 : 당신의 도움에 대한
import sys
import codecs
f = codecs.open(sys.argv[1],encoding='utf-8')
for line in f:
print repr(line).replace(unichr(252), 'ue')
감사합니다! (저는 파이썬 2.3을 사용하고 있습니다.)
참고. 따라서 U는 또한 유니 코드 시퀀스로 나타낼 수 있습니다. U + 0075 U + 0308 – elmuerte