2014-06-24 1 views
0

apache-spark 용 스칼라 API를 사용하여 추천 시스템을 구축하려고합니다.기존 데이터에서 권장 시스템 용 테스트 데이터 세트 생성

나는 모든 사용자가 평가 한 모든 항목에 대해 (User, Product, Rating) 형식의 데이터 집합을 가지고 있습니다. 권장 사항을 제공하려면 초기 데이터 집합에없는 모든 U, P 쌍과 함께 (U, P) 형식의 데이터 집합이 필요합니다. (사용자, 각 사용자가 구입하지 않은 모든 제품의 제품 쌍). 누구든지 이것을 할 수있는 어떤 직설적 인 방법을 알고 있습니까?

ps- 초기 세트에있는 사용자 나 항목과 다른 사용자 나 항목이 없다고 가정 할 수 있습니다.

도움이 될 것입니다.

답변

관련 문제