비 음성 매트릭스 분해의 예측을 테스트하는 올바른 방법은 무엇입니까? 데이터 세트가 사용자 및 시청 한 영화가있는 매트릭스 (등급 없음)라고 가정 해 보겠습니다. 먼저 매트릭스를 열차와 테스트 세트 (40 % 테스트 세트)로 나눕니다. 그런 다음 NMF로 학습 행렬을 인수 분해합니다. 그런 다음 테스트 매트릭스를 가져와 모든 영화 항목의 절반을 제거하고 실제 테스트 매트릭스가 얼마나 좋은지 다시 확인합니다.Trainingset으로 NMF를 평가하는 방법은 무엇입니까?
다른 평가 방법은 NMF와 함께 사용됩니까? 테스트 세트에서 영화 항목을 제거하는 것보다 더 좋은 방법이 있습니까?
내가 이해할 수없는 것이 있다고 생각하고, "추천자 평가"사이트의 myrrix도 읽었지만 나는 아직 잘못하고 있는지 알지 못합니다. 예측과 관련 데이터가있는 경우 ROC 등을 사용하는 방법을 알고 있지만 데이터를 예측할 때 사용해야하는 데이터는 무엇입니까? testset 항목의 "영화 반"이 아니라면 무엇입니까? – Puckl
교육 및 테스트 세트로 나눕니다. 트레이닝 세트에 대해 훈련하고 테스트 세트에 대해 테스트합니다. 어떤 이유로 든 테스트 세트를 부분 집합으로 나눌 필요가 없습니다. 테스트 데이터는 "올바른 답"이며, 테스트에서는 추천자가 해당 항목을 생성하는지 여부를 확인합니다. 이는 권장 사항으로 시작하는 것은 매우 문제가있는 가정이지만 여전히 사용됩니다. –