2014-03-31 4 views
2

한 달에 기차역에 대한 데이터가있는 데이터 프레임이 있습니다.이 중 3 개는 Station, Date, Hour의 인덱스입니다. I는 다음과 같이 수 :multiindex가없는 Pandas groupby 열

Station Date  Hour Passengers 
Berlin HBF 2012-12-24 12:00 1000 
Berlin HBF 2012-12-24 13:00 2000 
Berlin HBF 2012-12-24 14:00 1000 
Berlin HBF 2012-12-24 15:00 1000 
.... 
Stuttgart 2012-12-24 12:00 500 

나는 한 달에 역에 대한 금액에만 관심이 있기 때문에, 나는 최종 결과는 다음과 같이 보이도록, 역, 날짜 및 시간에 의해 GROUPBY 싶습니다 :

Station Passengers 
Berlin HBF 4000 
.... 
Stuttgart 500 

하지만이 솔루션에 팬더를 얻을 수 없습니다 오전, 나는 시도 :. byStation = traindata.groupby ([ '역', '날짜', '시간']) AGG (np.sum()) 그러나 단순히 모든 행을 가진 멀티 인덱스를 반환합니다 ...

+0

는 "역"으로 그룹화 할 것 같은데하고 "Passangers"A 행에 걸쳐 합을 수행

이 하나가 작동합니다. 여기에 다중 색인이 필요하지 않습니다 (솔루션에서 하나를 만들지 만, 원시 데이터와 동일하므로 아무 것도 쓸모가 없습니다) – dorvak

+0

어, 이제 오류가 나타납니다. 정말 고마워요! 답글로 의견을 추가 할 수 있습니까? –

답변

2

"역"으로 만 그룹화하고 "Passangers"열에서 합계를 계산하는 것처럼 보입니다. 여기에 다중 색인이 필요하지 않습니다. 당신의 솔루션은 하나를 만들지 만, 원시 데이터와 같은 것이기 때문에 그것은 쓸모가 없습니다. 단지

traindata.groupby("Station").Passengers.sum()