현재 이진 SVM Java 구현의 교육 단계를 테스트 중입니다. 등SVM 교육 세트 구축에 혼란이 있음
- 내 SVM은 숫자 값을 읽을 수있다, 나는 다음과 같이 작은 데이터를 테스트했습니다,하지만 난/스팸 스팸과 같은 알려진 데이터 세트, 이미지 내 SVM을 적용 할 필요가 그래서 필요 실제 데이터로 테스트 해보십시오.
- 나중에 이미지로 이동하고 싶습니다.
내가 다른 REPOS을 통해 검색, 실제 데이터 세트를 찾으려면,하지만 난 찾을 수있는 모든 등
수치 + 문자, 텍스트이었다 그리고 나는 spam Archive을 발견했다.
- 어떻게 진행하나요?
- 텍스트를 tfidf를 사용하여 숫자 데이터로 변환 한 다음 내 SVM을 적용해야한다고 생각합니다.
- 그러나 어떻게 그들을 1/-1 클래스로 표시합니까?
일반적으로 입력 형식이 올바 릅니까?
0 0 1
3 4 1
5 9 1
12 1 1
8 7 1
9 8 -1
6 12 -1
10 8 -1
8 5 -1
14 8 -1
스팸 아카이브 데이터를 위의 형식으로 가져 오려면 어떻게해야합니까?
사전 준비된 테스트 데이터를 찾고있는 경우 LIBSVM 그룹에 여러 가지 테스트 데이터가 있습니다. – tmyklebu
응답 해 주셔서 감사합니다. tmyklebu : 해당 데이터 세트에 대한 나와 링크를 공유 할 수 있습니까? –