2017-09-25 1 views
0

초급 RapidMiner 질문은 여기에 있습니다. 예를 들어, 예측 kNN 모델을 개발했다고 가정 해 봅시다. 교차 유효성 검사를 수행하고이 모델로 작업 한 전체 데이터 세트 (기차 및 테스트 세트)에 대한 예측을 수행하려고합니다. 어떻게 수행됩니까?RapidMiner의 전체 데이터 세트에 kNN 모델 적용

enter image description here

을하지만, K = 1 예측 오차 = 0, 분명히 발생하지해야하는, 그래서 만약 각 개체의 '라벨은'자신의 가장 가까운 이웃에 포함되어 있습니다 : 나는 다음 시도했습니다.

답변

0

당신이 맞는지, 훈련 된 것과 동일한 데이터에 모델을 적용하는 것이 잘못되었습니다. 일반적으로 누가 모델을 교육하기 위해 데이터의 일부분을 설정했는지 그리고 테스트를 위해 다른 부분 (교육과 관련이없는 부분)을 설정했을 것입니다.

일반적으로 교차 유효성 검사는 교육의 일부가 아니라 모델이 안정적이며 제시된 데이터에 대해 과도하게 훈련되지 않았 음을 확인하는 방법입니다.

applying, testingvalidating의 RapidMiner 튜토리얼 비디오를 살펴볼 것을 권장합니다.

RapidMiner community forum에서 질문하거나 다시 질문 할 수도 있습니다.

1

확인이 '교차 검증'내에서 '테스트 세트'를 추출하여 수행 할 수 있습니다은 아래 참조 : 교차 유효성 검사를 사용하는 경우

enter image description here 그래서 기본적으로 전체 데이터 집합 테스트 및 훈련 집합입니다 예상치도 출력에 여분의 열로 포함되며 평균인지 또는 최신 반복인지는 확실하지 않습니다.

+0

아, 미안하지만 질문이 잘못되었습니다. BTW를 사용하면 RapidMiner 프로세스의 XML 파일을 공유하는 것이 매우 편리합니다. – David

+0

답장을 보내 주셔서 감사합니다. kNN이 훈련/테스트에 관해서 특별한 경우 인 까다로운 문제는 여기에 흥미로운 토론이 있습니다. https://stackoverflow.com/questions/10814731/knn-training-testing-and-validation – Johan

관련 문제