팬더를 사용하여 텍스트 파일 형식으로 데이터 세트를 읽으려고했습니다. 그러나 일부 문자는 올바르게 인코딩되지 않습니다. 나는있어? 아포스트로피.pandas read_csv 이상한 문자
파일을 올바르게 인코딩하려면 어떻게해야합니까? 나는 시도했다
encoding = "utf8"
그러나 나는UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 2044: unexpected end of data
을 얻었다.encoding = "latin1"
그러나 이것은 나에게 많은 것을 주었다 ???
내가 숭고한에 내 데이터를 열
encoding = "ISO-8859-1" or "ISO-8859-2"
하지만이 또한 단지 어떤 인코딩처럼 내게 준은 ..., 나는 € ™ â이 문자를 얻었다.
업데이트 :하지만 난 \ u0102 \ u02d8 \ XE2 \ X82 \ u0179 \ XC2 \ u015, \ u0102 \ u02d8 \ XE2 \ X82 \ u0179 \ XE2 \ X84 \ u02d8
같은 것을 가지고 LOC를 사용하여 항목에 액세스 할 때
파일이 실제로 어떤 인코딩인지 알아야합니다. 파일을 어디서 받았습니까? – BrenBarn
ISO-8859-2를 사용해 보셨습니까? –
@AndyHayden 예, 나는 – user3362840