2016-10-27 1 views
0

이 부분에서는 새로운 기능입니다. 나는 일련의 데이터로 훈련하고 예측하고 싶다. 나는 오랫동안 노력해 왔는데, 나에게 무슨 잘못이 있는지 말해 줄 수 있니? 이 (내가 여기 위에 여러 행을 선택) 같은vowpal_wabbit의 입력 형식에 대해서

내 기차 데이터 보이는이 같은

-1 '13731#276 |f gender:0 age_range:2 action0:1 action1:0 action2:1 action3:0 
-1 '70175#4214 |f gender:0 age_range:4 action0:0 action1:0 action2:1 action3:0 
-1 '89370#2598 |f gender:1 age_range:2 action0:8 action1:0 action2:1 action3:0 
1 '89371#1250 |f gender:0 age_range:2 action0:0 action1:0 action2:1 action3:0 
-1 '89372#2792 |f gender:1 age_range:5 action0:0 action1:0 action2:1 action3:0 
1 '89372#962 |f gender:1 age_range:5 action0:0 action1:0 action2:1 action3:0 
-1 '89373#4472 |f gender:0 age_range:7 action0:5 action1:0 action2:1 action3:0 

테스트 데이터 :

1 '177796#1807 |f gender:0 age_range:5 action0:5 action1:0 action2:1 action3:0 
1 '155638#2445 |f gender:0 age_range:7 action0:3 action1:0 action2:1 action3:0 
1 '155639#658 |f gender:1 age_range:2 action0:5 action1:0 action2:1 action3:0 
1 '127479#2480 |f gender:0 age_range:7 action0:0 action1:0 action2:1 action3:0 
1 '127478#1245 |f gender:0 age_range:4 action0:1 action1:0 action2:1 action3:0 
1 '127473#4995 |f gender:1 age_range:4 action0:13 action1:0 action2:1 action3:0 
1 '127472#45 |f gender:0 age_range:7 action0:4 action1:0 action2:1 action3:0 

예, 그들은 더 다른 보이는 없습니다. 그것이 옳은지 나는 모른다. 나는 github에 많은 사람들이 이런 식으로 그들을 쓰는 것을 본다.

내 폭스 바겐 명령은 다음과 같다 :

vw -d train.vw --loss_function=logistic -f model.vw 
vw -d test.vw -t -i model.vw --loss_function=logistic -r shop.preds.txt 

음, 결과는 숫자가 실제로 덜 -2 이상이 될 것을 왜

-2.816693 177796#1807 
-2.817430 155638#2445 
-2.981194 155639#658 
-2.821442 127479#2480 
-2.823012 127478#1245 
-2.968556 127473#4995 
-2.816092 127472#45 
-2.820939 127471#4010 
-2.975476 127470#593 
-2.820105 155634#4103 
-2.799539 155635#2980 
-3.139279 127475#1469 

난 몰라

202178#1665,0.67 
156148#4730,0.50 
132360#2459,0.24 
132360#144,0.99 
180387#1534,0.48 
187963#1360,0.19 
158187#2534,0.54 
188206#4890,0.70 

가 적어도 나는 번호가 올바른지되고 싶어하지만, 모두 1 공동 :처럼 내 이상적인 결과는 이 문제를 해결하는 방법을 말해 주시겠습니까? 감사!

답변

1

당신은 확률을 예측하려면 당신이 가장 가능성이 레이블을 얻을 수 (-1 또는 +1), https://github.com/JohnLangford/vowpal_wabbit/wiki/Predicting-probabilities를 참조 vw -d test.vw -t -i model.vw --loss_function=logistic --binary -p shop.preds.txt

사용하려는 경우, 대신 vw -d test.vw -t -i model.vw --loss_function=logistic -r shop.preds.txt 당신이 vw -d test.vw -t -i model.vw --loss_function=logistic --link=logistic -p shop.preds.txt

를 사용한다

+0

당신이 맞아 ....... – fourth

+0

그리고 원시 예측 포맷을 원하는 CSV 포맷으로 변환하려면 다음을 사용하십시오 :'perl -lane 'print $ F [1], ",", $ F [ 0] 'shop.preds.txt' – arielf