2
일부 문자를 제거하기 위해 파이썬 정규 표현식을 사용하려고합니다. 문자열에서 유니 코드가 아닌 것처럼 보입니다.파이썬 비 유니 코드 문자를 제거하는 정규식
>>> xxx='Juliana Gon\xe7alves Miguel'
>>> t=re.sub('\w*','',xxx)
>>> t
' \xe7 '
이 \의 xe7 내가 제거하기 위해 노력하고 무엇 :
xxx='Juliana Gon\xe7alves Miguel'
t=re.sub('\w*','',xxx)
t
결과는 같다 : 여기 내 코드입니다. 누구든지 아이디어가 있습니까?
: 모든 ASCII 문자
(?!)
짧은 읽을 버전. 그것이해야하는 편지로 변환하고 싶습니다. 맞습니까? –나는 그것을 알아 낸 것 같아 .'xxx = 'Juliana Gon \ xe7alves Miguel' t = re.sub (re.sub ('\ w *', '', xxx) .strip(), '', xxx) t' –