Rapidminer를 처음 사용했습니다. XML 파일이 많아 키워드를 기반으로 파일을 수동으로 분류하고 싶습니다. 그런 다음이 데이터에 Naive Bayer 및 SVM과 같은 분류기를 교육하고 교차 유효성 검사기를 사용하여 성능을 계산하고 싶습니다.분류를 위해 Rapidminer를 사용하여 XML 파일을 처리하는 방법
당신은 나를이 다른 단계를 알려 주시기 바랍니다 수 있을까요?
나는 등 tokenising, TFIDF 같은 텍스트 처리 활동을 사용해야 하는가? 즉, 폴더의 모든 파일을 반복 차례로 각각 읽기 -