저는 파이썬에서 utf-8로 대량의 텍스트 파일을 대량 편집하려고 시도했지만이 오류는 계속해서 튀어 나오고 있습니다. 일부 비단 스크립트 또는 bash 명령에서이를 대체 할 수있는 방법이 있습니까? 내가 코드 사용 :모든 '0xa0'문자를 ''여러 개의 텍스트 파일로 대체하는 방법은 무엇입니까?
writer = codecs.open(os.path.join(wrd, 'dict.en'), 'wtr', 'utf-8')
for infile in glob.glob(os.path.join(wrd,'*.txt')):
print infile
for line in open(infile):
writer.write(line.encode('utf-8'))
및 오류 이런 종류의 가지고 :
Traceback (most recent call last):
File "dicting.py", line 30, in <module>
writer.write(line2.encode('utf-8'))
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa0 in position 216: unexpected code byte
왜 iconv를 사용하지 않으십니까? –
입력 파일에 사용 된 인코딩이 무엇인지 전혀 알지 못합니까? –