현재 매우 큰 .txt 파일 (몇 만 줄의 텍스트)에서 간단한 정규 표현식을 사용하려고합니다. 문제를 일으키는 가장 간단한 코드 :Python3의 UnicodeDecodeError
file = open("exampleFileName", "r")
for line in file:
pass
오류 메시지 :
Traceback (most recent call last):
File "example.py", line 34, in <module>
example()
File "example.py", line 16, in example
for line in file:
File "/usr/lib/python3.4/codecs.py", line 319, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 7332: invalid continuation byte
가 어떻게이 문제를 해결할 수 있습니까? UTF-8이 잘못된 인코딩입니까? 그리고 그것이 맞다면 어느 것이 옳은지 어떻게 알 수 있습니까?
감사합니다.
아마도 http://stackoverflow.com/questions/5552555/unicodedecodeerror-invalid-continuation-byte와 관련이 있습니다 – Jeff
'file -bi [your_filename]'의 출력을 게시하십시오. 인코딩을 받게됩니다. 그런 다음'open()'에'encoding' 인수를 제공하십시오. – light2yellow
-bi 명령은 무엇을합니까? –