2017-05-10 1 views
0

이 내 코드입니다 :Python3 - 팬더 리 샘플 기능

import pandas as pd 
data = pd.read_csv("temp.data",sep=';') 

data['Date'] = pd.to_datetime(data['Date']+' '+data['Time']) 
del data['Time'] 
data.rename(columns={'Date':'TimeStamp'}, inplace=True) 

data = data.reset_index() 
data['TimeStamp'] = pd.to_datetime(data['TimeStamp'], format='%d/%m/%Y %H:%M:%S') 
data['num'] = pd.to_numeric(data['num']) 
data = data.resample('1M') 

오류 : "형식 오류 : 만 DatetimeIndex, TimedeltaIndex 또는 PeriodIndex 유효하지만, 'RangeIndex'의 인스턴스 얻었다"을. 샘플 데이터 (원본 데이터 누락없이 값이 20 만 개 행이) : 오류에서 언급 한 바와 같이

17/12/2006;01:58:00;3.600 
17/12/2006;01:59:00;2.098 
17/12/2006;02:00:00;1.334 
17/12/2006;02:01:00;4.362 
17/12/2006;02:02:00;1.258 
17/12/2006;02:03:00;2.448 
17/12/2006;02:04:00;5.426 
17/12/2006;02:05:00;9.704 
+0

나는 심지어 날짜 형식으로 연주했다 : 형식 = '% d/% m/% Y % H : % M : % S'및 '% Y/% m/% d % H : % M : % S '모두 작동하지 않았습니다. 그것은 같은 오류입니다. – Anand

답변

0

를 다시 샘플링 할 때, 당신은 단지 연속 정수입니다 RangeIndex을 가지고 하나를 필요로하면서 포인트를 나타냅니다.

인덱스로 'TimeStamp' 열을 설정합니다 재 샘플링하기 전에

data.set_index('TimeStamp', inplace=True) 

추가. 'index'라고 불리는 여분의 열이 주위에 뜨기를 원하지 않는 한

data = data.reset_index() 

을 제외 할 수도 있습니다.

관련 문제