2012-05-01 2 views
0

이 나는 ​​사람이 다른 특성에 차 여부베이스 (성, 작업 및 이익)를 가지고 예측하려면이libsvm 입력 데이터? 예를 들어

userID 1 (or 2,3.....up to n) 
gender male (or female) 
working yes (or No) 
income >$5000/month (or <$5000) 
have_car yes (or no) 

같은 N 사람들을위한 데이터 세트를 가지고있다. 교육에 사용해야하는 형식 및 교육에 투입해야하는 사람 수, 테스트 할 사용자 수는 10,000 명입니다.

답변

0

형식 : 숫자 데이터를 사용해야합니다. 따라서 바이너리 디 터미네이션에는 0과 1을 사용할 수 있습니다.

교육/테스트 : 정확한 공식은 없습니다. 분류에 사용하는 기능이 많지 않은 것 같습니다. 즉, 엄청난 양의 trainingdata가 반드시 필요하지는 않습니다. 시작하기 50:50으로 나누고 합리적인 결과가 나오는지 확인하십시오.