2017-03-26 2 views
-1

저는 scikit-learn을 사용하여 Python으로 문자 인식 소프트웨어를 만들고 있습니다. [A-Za-z]라고 표시된 이미지의 큰 데이터 세트가 있습니다. 나는 선형 SVM을 사용하고있다. 52 개의 다른 레이블이있는 모든 샘플을 사용하여 모델을 훈련하는 것은 매우 느립니다.다른 SVM 모델 결합하기

13 개 섹션으로 나만의 교육 데이터 세트를 나누면 각 섹션에는 4 자의 이미지 만 있고 이미지는 1 개 섹션 이상일 수없고 13 개의 다른 모델을 교육 할 수 있습니다.

더 정확한 모델을 만들기 위해 어떻게 이들 모델을 결합 할 수 있습니까? 또는 13 가지 모델 모두에 대해 테스트 세트를 분류하고 개별 샘플의 결과를 신뢰 점수를 기준으로 비교하면 (가장 높은 점수를 가진 점수를 선택 함) 전체 모델의 정확도에 영향을 줍니까?

답변

0

데이터의 일종의 주문 감소가 필요한 것 같습니다.
주문 감소 후 데이터를 13 개의 큰 그룹으로 분류 한 다음 최종 분류 도구를 수행합니다.

내가 언급 한 첫 번째 단계는 Linear Discriminant Analysis입니다.

관련 문제