사실 OpenCV의 svm 파이썬 인터페이스를 사용하고 있으며 4 가지 범주로 데이터를 분류하려고합니다. 라벨 및 교육 데이터가 순서대로 표시되는 경우, 예를 들어 데이터가 라벨 1, 라벨 2, 라벨 3 및 라벨 4로 주문 된 4 개 그룹에 속하는 경우, 올바른 비율은 50 % 정도로 낮습니다. 그러나 훈련 데이터를 섞어 보았을 때 결과는 합리적이었습니다. 약 90 % 정확했습니다. 그래서 제 질문은 : 교육 데이터 순서가 최종 결과에 영향을 주는지 또는 교육 전에 데이터를 섞어 야합니까?SVM 다중 분류를위한 훈련 데이터를 셔플해야합니까?
답변
아니요 SVM 교육을 변경하지 않지만 코드에서 사용되는 일부 매개 변수 조정 방법은 주문에 따라 다를 수 있습니다. 예를 들어 무작위 추출없이 교차 유효성 검사를 사용하면 순서가 지정된 세트가 훨씬 어려워집니다. 결과적으로 접힌 폴드는 일부 클래스의 샘플도 0 개까지있을 수 있습니다. 한마디로
:
는 SVM 훈련은 "추가 방법"으로 사용- 에 의존 할 수
내 대답은 No입니다 this page을 기반으로 인공 신경망에 대한 역 전파 학습 알고리즘과는 달리 주어진 SVM은 ini에 관계없이 주어진 데이터 세트에 대해 항상 동일한 결정으로 수렴 적으로 수렴 할 것입니다 조건. 약 5000 점 미만을 포함하는 훈련 세트의 경우 그래디언트 디센트는이 최적화 문제에 대한 효율적인 해결책을 제공합니다 [Campbell and Cristianini, 1999].
먼저, 셔플 후 특징 벡터가 해당 레이블에 해당하는지 확인하십시오. 또한 모든 레이블에 두 경우 모두 많은 특징 벡터가 있는지 확인하십시오.
둘째, SVM이 변경되는지 여부를 관찰하기 위해 반복적으로 교육을 실행 해 볼 수 있습니다. 같은 순서로 셔플 링하지 않고 똑같은 데이터 세트를 사용하십시오. 이론상 볼록 최적화 문제는 고유 한 최대 값을 가져야하므로 변경되지 않습니다.
셋째, 훈련이 매우 느리게 수렴 될 경우 최대 반복 시간에 도달했을 가능성이 있습니다. 그런 다음 조기 종료하면 결과에 명백한 임의성이 발생할 수 있습니다.
비록 수학적으로 원시 솔루션이 SVM에서 고유하지만 이중 솔루션은 고유하지 않을 수 있습니다. 주로 바운드 변수 C의 선택에 달려 있습니다. This article은 원 솔루션과 이중 솔루션 간의 가능한 고유성을 분석했습니다.
- 1. svm 빛 훈련 세트
- 2. Caffe는 데이터를 셔플해야합니까?
- 3. 하나씩 scikit svm 훈련 (온라인 또는 확률 론적 훈련)
- 4. 다중 기능을 사용하는 SVM (Suport Vector Machine) 훈련
- 5. svm 데이터를 읽고 더 많은 데이터로 재 훈련 하시겠습니까?
- 6. Scikit을 사용하여 텍스트 분류를위한 데이터 준비 Learn SVM
- 7. 텍스트 분류를위한 교육 데이터를 찾으십시오.
- 8. Scikit-learn에서 다중 레이블 분류를위한 GridSearch
- 9. 다중 클래스 분류를위한 클래스 당 F1- 점수
- 10. OpenCV C++에서 자동차 판 인식을위한 SVM 훈련
- 11. SIFT 및 ORB 기능을 사용하여 OpenCV에서 SVM 분류 자 훈련
- 12. 객체 탐지를 위해 SVM- 조명으로 클래스 키퍼를 훈련 시키십시오.
- 13. sklearn svm 훈련 데이터에 대해 ROC가 0.5 미만인 영역
- 14. 텍스트 분류를위한 감독 학습의 동의어 주소 지정
- 15. 훈련 자료를 만드는 방법
- 16. 분류를위한 다중 출력 vs. 다중 단일 출력 신경망
- 17. 분류 된 훈련 된 트위터 덧글
- 18. openCV를 사용하여 데이터를 분류하는 SVM
- 19. 텍스트 분류를위한 텍스트 데이터를 정렬하는 scikit-learn의 표준 방법은 무엇입니까?
- 20. sklearn : 텍스트 분류를위한 교차 유효성 검사에서 벡터화
- 21. 데이터 분류를위한 기계 학습 알고리즘.
- 22. scikit에서 SVM overfitting 알아보기
- 23. 분류를위한 유전 알고리즘
- 24. weka SVM 다중 클래스 분류 자
- 25. 다중 클래스 SVM (하나 대 전체)
- 26. 훈련 데이터를위한 클러스터의 BOW 예측
- 27. Python에서의 SVM 알고리즘 구현
- 28. SVM
- 29. opencv의 HOG 설명자 용 SVM
- 30. 분류를위한 파이썬 벡터화
비율을 확인하기 위해 교차 유효성 검사를 사용했습니다. 어쩌면 그것이 핵심입니다! –