2014-12-28 3 views
0

DatandIndex의 계열을 날짜 형식 (YYYY-MM-DD)으로 팬더를 가지고 있고 각 인덱스가 하루와 관련하여 연속적인 영역에 레이블을 지정하려고합니다. 따라서 날짜가 누락 된 경우 날짜/시간 시리즈, 예 :pandas 일련의 DatetimeIndex에서 일련의 날짜를 감지합니다.

... 
2005-01-15 
2005-01-16 
2005-01-17 
2005-02-15 
2005-02-16 
... 

2005-01-17과 2005-02-15 사이의 누락 일수가 분명합니다.

내가 잘 모르는 도우미 기능을 기대하면서 팬더에서 쉽게이 방법을 찾을 수 없습니다. 더 일반적으로, 또한 numpy 해결책은 평가 될 것입니다.


@smci, 나는 dput()이 무엇인지 알고 있지만, 여기에 샘플 데이터를 생성하는 하나의 방법입니다하지 않습니다

import pandas as pd 
import numpy as np 

data = pd.concat([ 
    pd.Series(np.random.randn(3), pd.date_range('2005-01-15', '2005-01-17')), 
    pd.Series(np.random.randn(3), pd.date_range('2005-02-15', '2005-02-17')) 
]) 
+0

예제를 추가해 주셔서 감사합니다. 도! 'dput()'은 판다가 아닌 R에서 왔고, 내 두뇌는 잘못된 방향을 건넌다. – smci

+1

다음의 유사 율 : [두 행 사이의 시간차 계산] (http://stackoverflow.com/questions/25328125/calculating-time-difference-between-two-rows/), [시계열 판열에서의 간격 설명] (http://stackoverflow.com/questions/24815720/describing-gaps-in-a-time-series-pandas) 및 [pandas TimeSeries diff() 시리즈로 돌아갑니다] (http://stackoverflow.com/questions/24597446/pandas-timeseries-diff-reverts-to-series) – smci

답변

1

시도 뭔가 같은 : @ chrisb의 당

data.index - data.index.shift(1, freq=pd.DateOffset(1)) 

Calculating time difference between two rows

+0

이제 인덱스 인덱스와 이동 된 인덱스 사이에 다른 설정이있는 것 같습니다. 새로운 판다에서 이것을 어떻게 철자합니까? –

+0

@ChrisWithers : "지금"은 "Python 3.x"또는 "Pandas 0.17.x"를 의미합니까? 변화가 일어 났을 때 우리가 좁힐 수 있다면 도움이 될 것입니다 ... – smci

+0

Python 2.x, Pandas 0.18.x –

관련 문제