Apache Mahout에서 주어진 데이터 세트의 두 사용자간에 유사성의 수치 값을 얻는 방법을 아는 사람이 있습니까?Apache Mahout에서 두 사용자 간의 피어슨 상관 관계 유사성 표시
0
A
답변
0
데이터에는 어떤 것이 있습니까? 구매 나 조회수 또는 평점과 같은 상호 작용 데이터입니까?
그렇다면 아이템 유사성 또는 스파크 - 아이템 유사성이 작동하지만 피드 대신 항목 및 사용자 ID를 교환하십시오. 데이터를 사용자별로 한 행으로 구성된 희소 행렬로 인코딩하는 경우 rowsimilarity 또는 spark-rowsimilarity를 사용할 수도 있습니다.
hadoop 작업의 경우 ID는 Mahout ID, 항목 및 사용자에 대한 0이 아닌 행 및 열 번호 여야합니다. Spark 작업의 경우 원하는 ID를 사용할 수 있습니다.이 ID는 텍스트로 읽히므로 고유 한 문자열이어야합니다.
피어슨은 hadoop 작업에서만 지원됩니다. 스파크 작업은 로그 가능성 (log-likelihood) 비율 만 사용합니다. 협업 필터링 응용 프로그램에서 LLR은 다른 "유사성"메트릭보다 거의 항상 우수합니다.
관련 문제
- 1. SAS의 피어슨 상관 관계
- 2. 피어슨 상관 관계 분석의 해석
- 3. 피어슨 두 열 사이의 상관 관계
- 4. 정규화 후 피어슨 상관 관계
- 5. Scipy와 피어슨 다중 상관
- 6. Apache Spark - 상관 관계 계산
- 7. 스파크 데이터 세트에서 피어슨 상관 관계 계산
- 8. Apache Mahout에서 Pearson의 coeficient 뒤에있는 동기는 무엇입니까
- 9. 피어슨 상관 문제
- 10. 여러 독립적 인 상관 관계 (피어슨) R
- 11. 관련 텍스트 찾기 (두 텍스트 간의 상관 관계)
- 12. 피어슨 상관 계수
- 13. 피어슨 상관 관계 (Pyearson 's Correlation in Python)
- 14. 목록의 모든 항목 간의 상관 관계 계산
- 15. 특정 종류의 유사성 인덱스를 사용하는 방법을 아는 방법? 유클리드 거리와 피어슨 상관 관계
- 16. 여러 열이있는 두 데이터 프레임 간의 관계 또는 상관 관계
- 17. 데이터 행렬의 특정 열을 사용하는 피어슨 상관 관계 (cor.test)
- 18. matplotlib로 피어슨 상관 계수 플로팅
- 19. 두 목록 간의 유사성 측정
- 20. 두 신호 간의 유사성 : 간단한 측정
- 21. Numpy 배열 상관 관계
- 22. 하나의 열에있는 여러 변수 간의 상관 관계
- 23. 서비스 인스턴스와 웹 트래픽 간의 상관 관계
- 24. 데이터 프레임의 여러 변수 간의 상관 관계
- 25. R 상관 관계 계산
- 26. 시계열과 흑연의 상관 관계
- 27. 두 이미지 간의 상관 관계를 찾는 방법
- 28. 파이썬에서 시계열에서 두 변수의 상관 관계?
- 29. OpenCV에서 두 매트 파일의 상관 관계 계산
- 30. 두 단어 목록 간의 '상관 관계'찾기