오전 데이터 분석의 대부분은 R에서 Python으로 전환해야하며 다음 문제에 부딪 히고 있습니다. groupby()에 대한 개념적 이해의 결과 일 수 있습니다.그룹별로 하나의 열만()
나는 판다 (Pandas) 데이터 프레임을 가지고 있으며 여러 열을 기반으로 데이터를 요약하려고합니다. 다음 코드는 내가 원하는 것입니다.
이
df = df[(df["Lead Source"] != "chase") & (df["Lead Source"] != "SNE")]
ndf = df[["Date", "Lead Source", "Model Group", "Leads"]].groupby(["Date", "Lead Source"]).sum()
큰 보였다,하지만 난 다음을 실행할 때 하나의 '진짜'열이 것으로 나타났습니다. 또한, 행의 색인이 내가 기대했다 확실히 어떤 것으로 나타났다
ndf2.columns
Out[39]: Index([u'Leads'], dtype='object')
(참고로 NDF 단지 사본 ndf2입니다). 열 이름은 첫 번째 행에 표시되도록
어떻게 행을 조정할 수 있습니다. 결과는 다음과 같습니다.
Date Lead Source Leads
1/1/2014 ... ...
... ...
... ...