저는 R 및 SVM에 익숙하지 않으며 기능을 e1071
패키지에서 프로파일하려고합니다. 그러나, 입력 데이터의 크기를 다양하게 변화시키는 좋은 프로파일 링 범위를 얻을 수있는 큰 데이터 세트를 찾을 수 없습니다. 누구든지 svm
을 어떻게 일하는지 알고 있습니까? 어떤 데이터 집합을 사용해야합니까? svm
에 대한 특정 매개 변수가 더 어려워 질까요?프로파일 링 SVM (e1071) in R
성능을 테스트하는 데 사용하는 일부 명령을 복사합니다. 아마도 내가 여기에 노력하고 무엇을 얻기 위해 가장 유용하고 쉽게 : 내가 행과 열을 복제 데이터 집합을 계속 증가
#loading libraries
library(class)
library(e1071)
#I've been using golubEsets (more examples availables)
library(golubEsets)
#get the data: matrix 7129x38
data(Golub_Train)
n <- exprs(Golub_Train)
#duplicate rows(to make the dataset larger)
n<-rbind(n,n)
#take training samples as a vector
samplelabels <- as.vector([email protected]@data$ALL.AML)
#calculate svm and profile it
Rprof('svm.out')
svmmodel1 <- svm(x=t(n), y=samplelabels, type='C', kernel="radial", cross=10)
Rprof(NULL)
을하지만 난 ... svm
어렵게 작동 만드는 메모리의 한계를 대신 도달
교육용 점을 복제한다고해서 문제가 더 어렵지는 않습니다. 대부분의 SVM에서는 전체 데이터 세트가 주 메모리에 적합해야하기 때문에 결국에는 메모리 오류가 발생합니다. – karenu
그렇다면 적절한 데이터 세트로 어떻게 시도 할 수 있습니까? 내가 사용할 수있는 모범을 아십니까? – Manolete
예, 답을 볼 수있는 경우 사용할 수있는 데이터 집합을 나열했습니다. 또한 최상의 매개 변수를 찾으려면 매개 변수 튜닝을 수행해야합니다. 가장 정확한 매개 변수를 검색 할 때 일부 매개 변수를 검색 할 때 다른 매개 변수보다 시간이 오래 걸립니다. 저자의 libsvm에서 실용 가이드를 확인하십시오. http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CFYQFjAA&url=http%3A%2F%2Fwww.csie.ntu .edu.tw % 2F ~ cjlin % 2Fpapers % 2Fguide % 2Fguide.pdf & ei = WtLhT46NO-jw0gG30pHVAw & usg = AFQjCNFol0McRktHC6gsBxKXqQMvmQUFeg – karenu