0

내 목표는 3 종류의 미리 정의 된 세트에 트윗 무리를 분류하는 WEKA를 사용하는 것입니다 (예를 들어 뉴스, 교육, 스포츠)이 경우 훈련 세트와 테스트에서N 트윗 분류 WEKA에서 교차 검증을 배

(긴 웹 페이지 교육, 한두 줄 짹짹만 테스트).

이 문제에 대해 'N'배 교차 유효성 검사를 수행하는 방법.

훈련과 테스트 데이터를 하나의 파일에 적용하고 'n'폴드 교차 유효성 검사를 적용해야합니다. 아니면 분류기를 훈련시킨 다음 테스트 세트에 'n'폴드 교차 유효성 검사를 적용해야합니까? weka에서.

나는 후자가 의미가 있다고 생각하지만 확실하지 않습니다. 제발이 문제를 해결하는 데 도움이됩니다.

답변

0

데이터의 특성은 교육 및 설정 세트에서 동일해야합니다. 이 요구 사항은 N 배 교차 유효성 검사 기술을 사용할 수있게합니다. https://vimeo.com/29569892

: 모델 선택에 관한 문제에 대한

이를 보라
관련 문제