2016-11-24 2 views
0

방금 ​​작업 한 프로젝트에 대한 예측이 끝났습니다. 나는 어떤 시각화를 위해 그래프를 사용하려고하지만, 적절한 것을 찾는데 어려움을 겪고있다. 데이터는 꽤 크다. 아쉽게도 내 코드와 내 결과가 아래처럼 1 열의 모습을 그대로 유지합니다. 이것은 단지 1 열입니다. 어떻게 작동하는지 먼저 그래프 1 열에 표시하고 싶습니다. ive는 막대 그래프를 사용하려고 시도했지만 이상한 종류의 단색의 파란색 막대가 나타납니다. 그래서 무슨 그래프가 이런 종류의 정보에 좋은지 모르겠다. ( matplotlib 그래프 데이터 문제

교육 및 시험 열을 현명

기차 = pd.read_csv 일치해야 시험 및 대상 데이터 읽기

'C : /Users/Michael/Desktop/train.csv/train.csv를' , parse_dates = '날짜']) 시험 pd.read_csv = ('C : /Users/Michael/Desktop/test.csv/test.csv',parse_dates ='날짜 '])

# TRAINING data 
#Convert crime labels to numbers 
df_crime = preprocessing.LabelEncoder() 
crime = df_crime.fit_transform(train.Category) 
#Get binarized weekdays, districts, and hours using dummy variables 
days = pd.get_dummies(train.DayOfWeek) 
district = pd.get_dummies(train.PdDistrict) 
hour = train.Dates.dt.hour 
hour = pd.get_dummies(hour) 
#Build new array 
train_data = pd.concat([hour, days, district], axis=1) 
train_data['crime']=crime 
#train_data.head() 

#Repeat for test data 
days = pd.get_dummies(test.DayOfWeek) 
district = pd.get_dummies(test.PdDistrict) 

hour = test.Dates.dt.hour 
hour = pd.get_dummies(hour) 

test_data = pd.concat([hour, days, district], axis=1) 

features = ['Friday', 'Monday', 'Saturday', 'Sunday', 'Thursday', 'Tuesday', 
'Wednesday', 'BAYVIEW', 'CENTRAL', 'INGLESIDE', 'MISSION', 
'NORTHERN', 'PARK', 'RICHMOND', 'SOUTHERN', 'TARAVAL', 'TENDERLOIN'] 

training, testing = train_test_split(train_data, train_size=.60) 





#bernoulliNB 
# predicting only on the training data 
model_B = BernoulliNB() 
model_B.fit(training[features], training['crime']) 
predicted2 = np.array(model_B.predict_proba(testing[features])) 
log_loss(testing['crime'], predicted2) 
# predictingon the test data, using bernoulli model 
predicted3 = model_B.predict_proba(test_data[features]) 

#Write results 
result=pd.DataFrame(predicted3, columns=df_crime.classes_) 

# this is an example of 1 of my columns that i would like to graph 
    result['SUICIDE'] 
0   0.000432 
1   0.000432 
2   0.000760 
3   0.000903 
4   0.000903 
5   0.001089 
6   0.000903 
7   0.000903 
8   0.000550 
9   0.000744 
10  0.000903 
11  0.000550 
12  0.000550 
13  0.000744 
14  0.000744 
15  0.000219 
16  0.001089 
17  0.000903 
18  0.000760 
19  0.000760 
20  0.000760 
21  0.000550 
22  0.000744 
23  0.000903 
24  0.000760 
25  0.000787 
26  0.000760 
27  0.000265 
28  0.000903 
29  0.001089 

답변

0

당신은 결과물을 기대하는 측면에서 매우 모호 합니다만, 당신은 해상 패키지를 체크 아웃해야한다고 생각합니다. 특히 e 자습서 섹션 visualising univariate datasets을 참조하십시오. 출력을 시각화하기 위해 수행 할 수있는 작업에 대한 몇 가지 예와 아이디어를 제공해야합니다.

+0

완벽하게, 내가 찾고있는 것이 무엇인지, 감사합니다. – lupejuares