제 과제물로 야구 급여 데이터를 팬더 DataFrame
으로 가져와야합니다.
내 목표 중 하나는 일년에 모든 팀의 급여를받는 것입니다.pandas DataFrame 및 pandas.groupby로 급여 계산
그러나 나는 다음 작업으로 넘어 가기 위해 성공적이었습니다. 팬더가 필요합니다. DataFrame
. sumofSalaries.dtype
은 int64
입니다.
질문 :
1. 다음 코드의 데이터를 DataFrame으로 변환하려면 어떻게해야합니까?
sumofSalaries
에서 인덱스를 삭제하려면 어떻게해야합니까?
코드 :
import pandas as pd
salariesData = pd.read_csv('Salaries.csv')
#sum salaries by year and team
sumOfSalaries = salariesData.groupby(by=['yearID','teamID'])['salary'].sum()
del sumOfSalaries.index.names #line giving me errors
#create DataFrame from grouped data
df = pd.DataFrame(sumOfSalaries, columns = ['yearID', 'teamID', 'salary'])
df
_____________________________________________________________________________
sumofSalaries:
yearID teamID
1985 ATL 14807000
BAL 11560712
BOS 10897560
CAL 14427894
CHA 9846178
...and so on
_____________________________________________________________________________
df:
yearID teamID salary
yearID teamID
1985 ATL NaN NaN 14807000
BAL NaN NaN 11560712
BOS NaN NaN 10897560
CAL NaN NaN 14427894
가 왜 인덱스를 삭제하려고? 다른 말로하면, 그 중간 단계에서 무엇을 얻으려고합니까? – James
'Salaries.csv' 스 니펫을 추가 할 수 있습니까? – ramesh