2
'관심있는 두 열 (타임 스탬프)이있는 데이터가 있습니다 :'라벨 '과 수입니다. 나는 말, 하루 당 레이블 당 합계를 가진 시계열을 만들고 싶습니다. 이 문제를 해결하기 위해 resample
을 사용할 수 있습니까?팬더로 '깔끔한'데이터 프레임 재 샘플
구체 예 :이 예
import pandas as pd
import numpy as np
from itertools import cycle
idx = pd.date_range('2016-01-01', '2016-01-07', freq='H')
n = np.random.randint(10, size=24*6+1)
lst = [(l,c) for l,c in zip(cycle(['foo', 'bar']), n)]
df = pd.DataFrame(lst, index=idx, columns=['label', 'n'])
df.resample(???).sum()
는 대상 데이터 프레임 시간 인덱스 간격 당 총 수를 포함하는 두 개의 컬럼 (foo
및 bar
)를 포함한다.
내가 한 가능할 것으로 기대하지 않는다. 매우 강력한'groupby'로'resample'을 묶는 것입니다. 보조 노트로 TimeGrouper를 사용하여 세 번째 방법을 알아 냈습니다.'df.groupby ([pd.TimeGrouper ('W'), 'label'])'. –