2017-05-17 1 views
0

나는 college.csv 데이터 집합을 탐색하고 각 열에 대한 설명 통계를 얻으며 두 개의 범주 형 열을 삭제하면 작동합니다.Scipy Stats.describe and Pandas

college = pd.read_csv("C:/Users/Temple/ISLR_Datasets/College.csv") 
from scipy import stats 
college = college.drop("Unnamed: 0", 1) 
college = college.drop("Private", 1) 

for col in college.columns: 
    desc[col] = stats.describe(college[col]) 

하지만 난 그냥 열을 무시하고 피연산자 유형의 오류가 발생 재치있는 데이터 집합을 유지하려고하는 경우 :

for col in college.columns: 
    if(col!="Unnamed: 0" or col!="Private"): 
    desc[col] = stats.describe(college[col]) 

unsupported operand type(s) for /: 'str' and 'int' 

어떤 아이디어 다르게 무엇을하고 있는지 팬더 또는 NumPy와를?

+0

'College.csv' 데이터 세트 란 무엇입니까? 예외가 발생했을 때'col'은 정확히 무엇입니까? –

+0

파이썬 오류를보고 할 때 항상 * 완료 * 추적 (예 : 전체 오류 메시지)을 포함하십시오. 실제로 어떤 라인이 예외를 발생 시켰는지를 보여줄 것입니다. (이 경우'stats.describe (college [col]) '라고합니다.) –

답변

0

문제는 if condition이며 열 "Unnamed: 0""Private"을 무시할 수 없으며 항상 True입니다. stats.describe(college[col])은 열 "Unnamed: 0""Private"에 적용됩니다.

+0

고마워, 그냥 간단한 감시 야! – Tony