나는 마호 타트를 처음 사용했습니다.mahout collaborative-filtering 입력 바이너리 데이터 세트
나는 loglikelihood 유사성 측정과 함께 이미 mahout의 아이템 기반 알고리즘을 사용했다. 지난 스레드에서 추천자가 이진 값 (싫음)을 처리 할 때 loglikelihood 유사성을 사용하는 것이 더 낫다는 것을 읽었습니다. 나는 또한 mahout가 3 개의 가치 (싫어하는 것, 존재하지 않는 것)를 사용한다는 것을 읽었다. 그래서 나는 입력 데이터 셋 파일의 형식에 대해 조금 혼란스러워합니다.
입력 파일 형식이 이와 같아야합니까?
userId, itemID
여기서 기본 설정은 1입니까?
싫어요 정보를 데이터 집합에 넣을 수있는 방법이 있는지 알고 싶습니다.
I, 예를 들어, 입력 데이터 집합 파일을 제외하고 본 같을 것이다 :
사용자 ID, 상품 ID, binaryPreference 1 15 1.0
2, 35, 0
1 25 , 1.0 ......
도와주세요! 고맙습니다!