0

비 음성 매트릭스 분해의 예측을 테스트하는 올바른 방법은 무엇입니까? 데이터 세트가 사용자 및 시청 한 영화가있는 매트릭스 (등급 없음)라고 가정 해 보겠습니다. 먼저 매트릭스를 열차와 테스트 세트 (40 % 테스트 세트)로 나눕니다. 그런 다음 NMF로 학습 행렬을 인수 분해합니다. 그런 다음 테스트 매트릭스를 가져와 모든 영화 항목의 절반을 제거하고 실제 테스트 매트릭스가 얼마나 좋은지 다시 확인합니다.Trainingset으로 NMF를 평가하는 방법은 무엇입니까?

다른 평가 방법은 NMF와 함께 사용됩니까? 테스트 세트에서 영화 항목을 제거하는 것보다 더 좋은 방법이 있습니까?

답변

0

나는 이것이 이전에 물어 본 질문과 실질적으로 같다고 생각합니다. NNMF는 협업 필터링을 구현하는 유일한 방법입니다. 낮은 순위 행렬 인수 분해의 충실도를 평가하는 것은 협업 필터링 결과를 평가하는 방법이 아닙니다. 낮은 순위 인수 분해의 요점은 입력과 정확하게 일치하지 않는다는 것입니다.

이미 익숙한 정밀도, 회수율, AUC 등의 측정 값을 사용합니다. 테스트 세트를 더 이상 분할하지 않습니다. 교차 검증 세트 나 다른 것을 만들지 않습니다. 그래서 나는이 점이 무엇인지 모른다. "관련"데이터 세트로 테스트 세트를 그대로 사용하십시오.

+0

내가 이해할 수없는 것이 있다고 생각하고, "추천자 평가"사이트의 myrrix도 읽었지만 나는 아직 잘못하고 있는지 알지 못합니다. 예측과 관련 데이터가있는 경우 ROC 등을 사용하는 방법을 알고 있지만 데이터를 예측할 때 사용해야하는 데이터는 무엇입니까? testset 항목의 "영화 반"이 아니라면 무엇입니까? – Puckl

+0

교육 및 테스트 세트로 나눕니다. 트레이닝 세트에 대해 훈련하고 테스트 세트에 대해 테스트합니다. 어떤 이유로 든 테스트 세트를 부분 집합으로 나눌 필요가 없습니다. 테스트 데이터는 "올바른 답"이며, 테스트에서는 추천자가 해당 항목을 생성하는지 여부를 확인합니다. 이는 권장 사항으로 시작하는 것은 매우 문제가있는 가정이지만 여전히 사용됩니다. –

관련 문제