2016-11-10 1 views
1

Numero Sign이 몇 개있는 파일로 작업하고 있습니다. 여기 올바른 Python Pandas read_csv ' u2116', 'Numero Sign'에 대한 인코딩

은 상위 3 개 라인을 복사하여 CSV 파일에서 직접 붙여 넣을 수 있습니다

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
    â„– Summer 01 ! 02 ! 03 ! Total â„– Winter 01 ! 02 ! 03 ! Total â„– Games 01 ! 02 ! 03 ! Combined total 
Afghanistan (AFG) 13 0 0 2 2 0 0 0 0 0 13 0 0 2 2 

나는 다음과 같은 오류 얻을 read_csv 팬더 사용하여 파이썬 3.5을 사용하여 아나콘다에서 파일을 가져 오려고 :

을 이런
UnicodeEncodeError: 'charmap' code can't encode character '\u2116' in position 104: character maps to <undefined> 

내가하려고하면

df=pd.read_csv('myfile.csv', encoding='utf_8') 

가 나는 또한 표준 EN 시도 glish codecs는 기본적으로 다음과 같은 오류 코드로 나열됩니다. https://docs.python.org/3/library/codecs.html#standard-encodings

내가 다르게 시도해야 할 것에 대한 제안이있는 사람이 있습니까?

나는 CSV 파일에 가서 파일에서 'NUMERO 로그인'을 삭제하고 그런 식으로 사용, 향후 독자 나

+1

원시 데이터 라인을 게시 할 수 있습니까? 아마도 'utf-16'도 시도했을 것입니까? – EdChum

+0

@EdChum, 나를 위해 이것을 보았습니다. – SDS

+0

그 줄을 utf-8로 인코딩하면 올바르게 디코딩됩니다. 원시 파일에 대한 링크를 게시 할 수 있습니까? – EdChum

답변

0

, 당신의 도움을 주셔서 감사합니다. 앞으로의 프로젝트에서 문제가되지 않기를 바랍니다. 모두에게 감사드립니다. Me :

관련 문제