많은 utf-8 텍스트 행을 포함하는 파일이 있습니다. 아래에 의해,에 의해, 그것은 중국어입니다.utf8 문제가있는 파이썬 정규 표현
PROCESS:类型:关爱积分[NOTIFY] 交易号:2012022900000109 订单号:W12022910079166 交易金额:0.01元 交易状态:true 2012-2-29 10:13:08
파일 자체가 utf-8 형식으로 저장되었습니다. 파일 이름은
여기 내 파이썬 코드가 xx.txt, ENV는 python2.7
#coding: utf-8
import re
pattern = re.compile(r'交易金额:(\d+)元')
for line in open('xx.txt'):
match = pattern.match(line.decode('utf-8'))
if match:
print match.group()
여기에 문제가있는 것은 내가 아무 결과도 얻지 임.
交易金额:0.01元
에서 십진수 문자열을 얻으려면 0.01
입니다.
왜이 코드가 작동하지 않습니까? 아무도 나에게 그것을 설명 할 수 있을까? 나는 전혀 모른다.
감사합니다. 매우 감사합니다. – castiel
re.UNICODe가 나를 위해 일했습니다! – Parham