2014-03-01 9 views
2

나는 시계열을 가지고 있으며 같은 컬럼에 다른 기능을 적용하고 싶습니다.같은 열에 다른 리샘플링 방법 적용하기 (팬더)

주요 열은 무게입니다. 다시 샘플링 된 기간의 무게에 대한 평균과 최대 값을 모두 표시하는 df를 만들고 싶습니다. 나는 내가 할 수있는 알고 : 이것은 비효율적 인 것 같습니다

df.resample('M', how = {'weight':np.max}, kind='YearEnd')

df1.resample('M', how = {'weight': np.mean}, kind='YearEnd')

.

최적가 : df.resample('M', how = {'weight': np.mean, 'weight':np.max}, kind='YearEnd')

답변

3

이보십시오. https://github.com/pydata/pandas/issues/6515

: 내가 생각하지 않는 딕셔너리가 너무 어렵다,이 개선에 대한 문제를 열 ​​방법을 지원

In [23]: df = DataFrame(np.random.randn(100,1),columns=['weight'],index=date_range('20000101',periods=100,freq='MS')) 

In [24]: df.resample('A',how=['max','mean']) 
Out[24]: 
       weight   
       max  mean 
2000-12-31 1.958570 -0.312230 
2001-12-31 1.739518 0.035701 
2002-12-31 2.503437 0.169365 
2003-12-31 1.115315 0.149279 
2004-12-31 2.190617 -0.087536 
2005-12-31 1.286224 0.037669 
2006-12-31 1.674017 0.147676 
2007-12-31 2.107169 -0.064962 
2008-12-31 -0.163863 -0.572363 

[9 rows x 2 columns] 

관련 문제