알 수없는 테스트 데이터를 분류하기 위해 선형 svm 분류기를 작성하려고합니다.테스트 및 교육 세트의 기능 수가 다릅니다.
그러나 텍스트 문서의 길이가 고정되어 있지 않으므로 새 문서의 피쳐 길이가 같은지 확인하려면 어떻게해야합니까?
의 Src와 신지는 속성 # 다를:! 2 = 1484
LibSVM classifier = new LibSVM();
classifier.setKernelType(new SelectedTag(LibSVM.KERNELTYPE_LINEAR, LibSVM.TAGS_KERNELTYPE));
classifier.buildClassifier(data1);
System.out.println("done");
data2.setClassIndex(data2.numAttributes() - 1);
double res = classifier.classifyInstance(data2.instance(0));
데이터 2 arff
@data
'This is a string!','?'
내가 가진 속성 같은 수의 특징 벡터를 만들 수 어쨌든 있나요 현재 모델? 아니면 다른 해결책이있을 것입니다.
나는 훈련 및 테스트 데이터에서 문자열을 단어 벡터 필터에 적용하여 모델을 작성했습니다. 그러나 모델을 다시 작성하지 않고 새로운 알 수없는 테스트 데이터로 작업하려면이 모델이 필요합니다. 어쨌든이 새로운 기능에 새로운 알 수없는 데이터를 추가 할 수 있습니까? – aceminer
알 수없는 테스트 데이터로 작동합니다. 내 대답을 좀 더 명확하게 편집했습니다. – Sentry