2016-10-21 6 views
0

현재 20 개의 기능과 400,000 개의 행이있는 데이터 세트를 작업 중입니다. SVM을 사용하는 다중 클래스 분류를 위해 e1071 라이브러리를 사용하고 있습니다. 나는이 코드를 가지고 있으며 결과를 얻기까지 약 2 일이 걸린다. 같은 라이브러리를 사용하여 시간 복잡성을 줄일 수있는 방법이 있습니까? R에서 다른 라이브러리 또는 옵션을 어떤 점에서 고려해야합니까?SVM의 실행 시간을 줄이는 방법

svm.model <- svm(y ~., data = traindata, gamma = 0.01, cost = 10, kernel= "radial") 
+0

1000-10000 행을 서브 샘플링 해보고 샘플 수가 적 으면 어떤 성능을 얻는 지 알 것입니다. 괜찮은 모델을 얻는 데 충분한 정보 일 수 있습니다. 다른 커널도 사용해보십시오. – zacdav

+0

예, 시도했습니다. 그러나 전체 데이터와 비교하여 크기 40K의 샘플을 가져올 때 오류 차이가 중요합니다. – user2991421

+0

교육/테스트, 교차 변형 확인 등을 수행하고 있습니까? – zacdav

답변

1

성능 향상을 제공하는 기능의 수를 줄이기 위해 치수 감소 (예 : PCA 사용)를 시도해 보시기 바랍니다.

관련 문제