1

사용자 환경 설정 (파생 된 환경 설정)을 기반으로 제품을 추천하는 데 명시적인 열차 기능을 사용하려고 시도했으며 MSE는 교육 및 테스트 데이터 세트 모두에 적합합니다. (람다 = 0.01)Spark mllib : implicitTrain과 explicitTrain의 차이점

동일한 데이터 I는 MSE 둘 시험 훈련 데이터 세트에 대해 20 배 증가시킨다. (람다 0.01, 알파 = 1.0 =)

이제 I이 다른 것을 이해 trainImplicit 사용할 때 algos하지만 내재적 인 것이 명백한 것보다 잘 작동하는지 판단하려면 어떻게해야합니까?

+0

명시 적 등급 값은 무엇입니까? 정규화되지 않은 경우와 예를 들어 1-5 사이의 등급이있는 경우 주어진 등급에 대한 정사각형 오류는 0에서 16 사이가 될 것이기 때문에 질문합니다. 암시 적 피드백이있는 경우 0과 1 사이가 될 것이기 때문입니다. –

+0

또한 명시 적에서 암시 적으로 어떻게 이동합니까? 내게는 명시 적으로 각 사용자에 대해 알 수없는 제품 (평가하지 않은 제품)과 일부 제품에 대한 평가 (등급이 0-1 임에도 불구하고)가 있습니다. 암시 적으로 암시 적으로 0과 한 쌍이 많습니다. 1 –

답변

2

기본적으로 암시 적 열차와 명시 적 열차의 차이는 암시 적으로 해당 항목과 관련된 암시 적 동작 만있을 때 암시 적으로 사용한다고 가정합니다. 조회수, 클릭 수, 구매액, 좋아요 수, 공유 수 등을 표시합니다. 명시 적으로 추천하려는 항목에 대한 명시적인 요율이있는 경우이를 사용한다고 가정합니다. 이제이 알고리즘의 적용 분야에 대해 영화 추천 시스템을 할 때와 동일한 상황이 발생했으며 명시 적 데이터 세트에서 교육 할 때 왜 암시 적으로 더 좋은 결과를 얻을 수 있는지 설명 할 수 없습니다. 내 견해로는 MSE가 적절한 성능 측정 방법입니다. 그리고 당신이 할 수있는 한 가지는 spark mllib의 구현을 검토하고 이유를 이해하려고 시도하는 것입니다. 미안하지만 전혀 대답하지 않았다면.

+0

"명시 적 데이터 세트에서 교육 할 때 암시 적 결과가 더 명확합니다."어떻게 측정 했습니까? 암시 적 algo에 대해 0-1 사이의 등급/기본 설정이 필요합니까? – Shadow

+0

다시 핑을해서 죄송 합니다만 ^ – Shadow

관련 문제