2016-08-05 3 views
0

헤더가없는 CSV 파일에 데이터가 있습니다. 일부 열을 구문 분석해야합니다.팬더 : csv의 열을 구문 분석하십시오.

데이터의 일부는 :

-1.0,-0.0246259814315,1174.60023796 
1.0,-0.978057706084,1083.19880269 
-1.0,0.314271994507,-1472.97760911 
-1.0,0.179751565771,231.017267343 
1.0,-1.26254374278,-778.271726463 
-1.0,0.249969939456,-52.8014826538 
1.0,-1.87039747875,-324.235348241 

I은 ​​두 번째와 세 번째 컬럼을 로딩 할 필요가있다. 나는 train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[2, 3]) 사용하지만 당신이 필요로하는, 그래서 그것은 IndexError: list index out of range

+1

대괄호를 묶어야합니다. in_X = pd.read_csv ("perception-train.csv", parse_dates = [1])'usecols의 경우도 열의 이름이나 서수 위치 목록을 전달해야합니다. – EdChum

+1

'parse_dates = [1]'을 사용하고 칼럼 인덱스는 0 기반이라는 것을 명심하십시오. – albert

+0

@EdChum 두 개의 열을 scecify하려면 두 개의 브래킷을 사용해야합니까? – ldevyataykina

답변

1

IIUC 지수는 0을 기준으로 반환

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[0], usecols=[1, 2]) 
:이 또한 당신의 날짜 COL을 변경해야하는 것을 의미하는 경우도

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[1, 2]) 

는 나도 몰라

그러나 데이터를 보면 이상한 것처럼 첫 번째 또는 두 번째 열을 datetime으로 해석하는 방법을 이해하지 못합니다.

관련 문제