,
은 필드를 구분하는 데 사용되는 구분 기호이지만 소수점을 나타내는 기호 (독일어 표기)를 나타내는 기호로 추가되는 CSV 파일을 받았습니다.팬더가 형식이 잘못됨 CSV
결과적으로 일부 행의 열 수는 달라집니다. 이상하게도 탁월한 파일을 파싱/읽습니다. 판다에서도 그러한 파일을 읽을 수 있습니까? 내가로드
first, number, third
some, 1, other
foo, 1.5, bar
baz, 1,5, some
의 내용에 ~/Downloads/foo.csv
파일을
pd.read_csv(os.path.expanduser('~/Downloads/foo.csv'), sep=',', decimal=',')
: 지금까지 난 단지
Error tokenizing data. C error: Expected 97 fields in line 3, saw 98
편집 여기
는 최소한의 예입니다 비슷한 뭔가있어 R의 데이터는See spec(...) for full column specifications.
Warnung: 1538 parsing failures.
row col expected actual
1 -- 93 columns 97 columns
2 -- 93 columns 98 columns
3 -- 93 columns 97 columns
4 -- 93 columns 102 columns
5 -- 93 columns 99 columns
팬더에는 이와 같은 허용 모드가 있습니까?
재현 가능한 샘플 데이터 세트를 게시 할 수 있습니까? – MaxU
완료. 편집을 참조하십시오. –
행당 잠재적으로 영향을받는 열은 하나 뿐이므로 정확한 데이터 표현입니까? – DSM