나는 MLlib를 사용하여 Spark에서 암시 적 데이터를위한 추천 시스템을 구축 중입니다. 나는 이미 구현 된 기능을 찾아서 사용자들에게 교육 도중 볼 수 없도록 권고하고 아무것도 찾지 못했습니다. 그러한 기능이 존재하는지 아는 사람이 있습니까? 그렇지 않으면 아무도 너무 효율적으로 구현하는 방법에 대한 조언을 가지고 있습니까?Spark MLlib 공동 필터링
0
A
답변
2
여기에는 기능이 없습니다. 실제로 MLlib에서 얻은 간단한 RDD 기반 모델을 기반으로 즉각적인 권장 사항을 만드는 것은 실제로 불가능합니다. 당신은 http://blog.cloudera.com/blog/2014/03/why-apache-spark-is-a-crossover-hit-for-data-scientists/에서,이 블로그 게시물에서 구현을 볼 수 있습니다
def recommend(questionID: Int, howMany: Int = 5): Array[(String, Double)] = {
// Build list of one question and all items and predict value for all of them
val predictions = model.predict(tagHashes.map(t => (questionID,t._1)))
// Get top howMany recommendations ordered by prediction value
val topN = predictions.top(howMany)(Ordering.by[Rating,Double](_.rating))
// Translate back to tags from IDs
topN.map(r => (tagHashes.lookup(r.product)(0), r.rating))
}
lookup
비록 매우 느린 있습니다. (< 10ms와 같이) 권장 사항을 신속하게 구현하려면 RDD를 핵심 표현으로 통합해야합니다.
그러나 일괄 처리 권장 사항 만 있으면 위와 같은 방법을 조인과 함께 효율적으로 만들 수 있습니다.
관련 문제
- 1. Spark MLlib recommender 엔진의 메소드
- 2. Spark mllib 스칼라로 분류하기
- 3. Spark MLLib의 대형 데이터 세트에 대한 공동 필터링 속도 향상
- 4. 상위 N 권장 사항을 생성하는 MLlib 공동 필터링
- 5. LogisticRegressionWithLBFGS의 setNumClasses는 무엇입니까? Spark-Mllib
- 6. Spark - 드라이버에서 실행되는 MLlib computeSVD
- 7. Spark ML과 MLLIB 패키지의 차이점
- 8. Spark MLLib LogisticRegression을위한 TFIDF 구현
- 9. Spark mllib : 문자열 분류 기능을 int 형식으로 변환하는 방법
- 10. 스파크 MLlib - 협업 필터링 암시 피드
- 11. Spark MLlib LDA 입력 형식 이해
- 12. NoClassDefError in mllib 1.1.0
- 13. Spark Scala에서 네임 스페이스 xml 필터링 필터링
- 14. Java Eclpise 프로젝트에 MLlib Apache Spark 라이브러리를 어떻게 설치합니까?
- 15. Spark MLLib Logistic Regression에서 신뢰 점수를 얻는 방법
- 16. java - Spark MLlib - 문자열을 TF-IDF LabeledPoint RDD로 변환
- 17. Spark/MLlib : 비선형 모델을 훈련하기위한 피쳐 사각형 추가
- 18. Spark MLlib FPGrowth가 실행 중이지만 자주 항목 집합이 표시되지 않음
- 19. KMeans with Spark 1.6.2 VS Spark 2.0.0
- 20. MLLib 결과 표시 (스칼라)
- 21. mllib 입력 파일 형식
- 22. MLLIb : 모델 저장 및로드
- 23. 공동
- 24. 공동 작업 필터링 : 개인화되지 않은 항목 간 유사성
- 25. 뉴스 기사 또는 블로그 게시물에 대한 공동 필터링
- 26. apache spark MLLib : 문자열 기능에 대해 레이블이 지정된 점을 만드는 방법은 무엇입니까?
- 27. 장기간 실행되는 오프라인 Spark (MLlib) 모델 교육 후에 실시간으로 예측을 얻으려면 어떤 절차가 필요합니까?
- 28. Spark 임의 포리스트 바이너리 분류기 메트릭
- 29. Spark Random Forest 오류
- 30. Apache Spark | 다양한 통계 알고리즘에 대해 spark MLlib에 필요한 입력 파일 형식은 무엇입니까