저는 연례 야구 통계를보고 있으며 히트 수와 관련하여 지난 3 년간의 성과를 되돌아 보면서 롤링 평균을 계산하고 싶습니다. 그러나 필자는 데이터 세트가 3 년 이상으로 돌아가는 동안 1 명의 싱글 플레이어가 1-2 년 동안 리그에 머물러있을 수 있으며 3 년 동안 관찰 할 가치가 없을 것이라고 설명하고 싶습니다. 롤링 평균을 계산하십시오. 예를 들어 내가 계산하는 GROUPBY 및 통합/변환 (또는 다른 프로세스)를 사용하는 것이 어떻게관측 수를 보장하지 않고 팬더 롤링 평균을 사용하는 방법
In[6]: df = pd.DataFrame({'PLAYER_ID': ['A', 'A', 'A', 'B', 'B'],
'HITS': [45, 55, 50, 20, 24]})
In[9]: df
Out[9]:
PLAYER_ID HITS
0 A 45
1 A 55
2 A 50
3 B 20
4 B 24
을 압연 3 년을 최대로 각 플레이어 에 대한 역사적인 합계을 의미 한 후 바로 사용할 수있는 최대 사용 3 년 미만의 역사적인 성과 데이터를 보유한 플레이어에 대한 역사적인 관찰은 가능한가?
확실히 내 답변은 팬더 패키지에 있지만 모든 솔루션에 관심이있을 것입니다.
감사합니다.
실제로 원하는대로 꾸밀 수 있습니까? 플레이어 당 1 ~ 3 회의 관측만으로이 데이터는 롤링 평균이 특히 의미가 없기에 너무 희박합니다. –
설명의 단순화를 위해 연율 화되었습니다. 게임 레벨 데이터에서 다른 것들과 함께이 작업을 수행 할 것입니다. – Alt182
[샘플링 빈도] (http://pandas.pydata.org/pandas-docs/stable/timeseries.html#resampling)은 무엇입니까? –