영화, 음악, 도서 추천에 협업 필터링 (CF)이 사용되는 방법은 알려져 있습니다. 논문 'Collaborative Topic Modeling for Recommending Scientific Articles'에서 작가는 ~ 5,500 명의 사용자와 ~ 17,000 개의 과학 기사에 적용되는 공동 필터링의 예를 보여줍니다. ~ 200,000 개의 사용자 - 항목 쌍으로 사용자 - 기사 행렬은 분명히 매우 희박합니다.뉴스 기사 또는 블로그 게시물에 대한 공동 필터링
matrix factorization과 협력 필터링을 수행하면 Twitter에 공유 된 모든 뉴스 기사를 어떻게 볼 수 있습니까? 이 매트릭스는 CF를별로 적용 할 수 없도록 (과학 기사의 경우보다) 드문 드문 될 것입니다. 물론, 우리는 콘텐츠 인식 분석 (기사의 텍스트를 고려)을 할 수는 있지만 그건 내 초점이 아닙니다. 또는 우리는 사용자 기사 매트릭스를 더 조밀하게 만들기 위해 시간 창을 제한 할 수 있습니다 (초점, 말하자면 마지막 날이나 주에 공유 된 모든 뉴스 기사). 다른 모든 아이디어는 행렬이 매우 희소하다는 사실과 어떻게 싸울 수 있습니까? CF 분야의 뉴스 기사 추천을위한 연구 결과는 무엇입니까? 많은 감사드립니다!
희소 행렬의 문제는 무엇입니까? 행렬이 메모리에 맞지 않거나 결과가 부정확하다는 뜻입니까? – ffriend