2017-04-24 1 views
0

를, 데이터의 행 인덱스가 지정된 이유파이썬 팬더 양식 라벨 <index_1>의 데이터를 읽어 속성이있는 인덱스가 지정되어 있지 않기 때문에 예를 들어 <val_2>

-1 0:183.3575741549828 1:3.11164735151736 2:2.171277907851733 3:26.68849990272964 4:24.76677388937082 5:0.02710337995527495 

이유처럼 보인다는 0 인 것으로 가정한다. 그것은 다음과 같은 오류를 보여주고있다

train = pd.read_csv('train.csv', header=None, delim_whitespace=True).values 

: 내가 여기에 문제를 알아낼 수 없습니다

train = pd.read_csv('train.csv', header=None, delim_whitespace=True).values

File "/usr/local/lib/python2.7/site-packages/pandas/io/parsers.py", line 646, in parser_f return _read(filepath_or_buffer, kwds)

File "/usr/local/lib/python2.7/site-packages/pandas/io/parsers.py", line 401, in _read data = parser.read()

File "/usr/local/lib/python2.7/site-packages/pandas/io/parsers.py", line 939, in read ret = self._engine.read(nrows)

File "/usr/local/lib/python2.7/site-packages/pandas/io/parsers.py", line 1508, in read data = self._reader.read(nrows)

File "pandas/parser.pyx", line 848, in pandas.parser.TextReader.read (pandas/parser.c:10415)

File "pandas/parser.pyx", line 870, in pandas.parser.TextReader._read_low_memory (pandas/parser.c:10691)

File "pandas/parser.pyx", line 924, in pandas.parser.TextReader._read_rows (pandas/parser.c:11437)

File "pandas/parser.pyx", line 911, in pandas.parser.TextReader._tokenize_rows (pandas/parser.c:11308)

File "pandas/parser.pyx", line 2024, in pandas.parser.raise_parser_error (pandas/parser.c:27037)

pandas.io.common.CParserError: Error tokenizing data. C error: Expected 132 fields in line 5, saw 143

는 내가 문을 사용하려고 해요. 어떤 도움이라도 좋을 것입니다!

+0

당신이 읽을 수있는 형식으로 오류를 수정하시기 바랍니다 수 있습니까? 또한 데이터의 행을 강조 할 수는 없습니다. 그게 한 줄의 사전 이니? – splinter

+0

@splinter 이것은 csv 파일의 한 줄입니다. 속성 수는 고정 숫자 4125 (0-4124)입니다. 행은 학습 예제의 속성 값을 지정합니다. 2 : 1231은 속성 2가 1231임을 나타냅니다. –

답변

0

데이터 설명과 오류 메시지에 따르면 내 생각에 csv 파일의 행에는 행 당 동일한 양의 필드가 없습니다. 필드 열을 지정하십시오 :

my_cols = range(0,4125) 
train = pd.read_csv('train.csv', header=None, delim_whitespace=True, names=my_cols).values 

여기에 더 많은 도움을 찾기 : 여기 import csv with different number of columns per row using Pandas과 : Handling Variable Number of Columns with Pandas - Python

+0

이 방법으로 문제가 해결 되었습니까? – Nyps

관련 문제