2012-03-05 4 views
2

나는 여러 블로그에서 가장 인기있는 게시물을 찾는 Techmeme 같은 블로그 수집기를 구축 중입니다. Techmeme와는 달리 먼저 다양한 RSS 피드의 블로그 게시물을 집계 한 다음 헤드 라인과 관련 URL을 데이터베이스에 저장합니다. 그 후, 나는 가장 인기있는 블로그 게시물을 찾아야 만합니다.인기 블로그 게시물 순위 알고리즘

상위 블로그 게시물 헤드 라인을 정의하기 위해 모든 블로그의 모든 게시물에 대해 Facebook 및 Twitter 공유 수를 추적하고 블로그 게시물에 공유 수를 랭크합니다. 하지만 일부 블로거는 사기성 공유로 공유 횟수를 늘리면 속일 수 있기 때문에 이것이 최선의 해결책은 아닙니다.

제 질문은 가장 인기있는 게시물을 정의하기 위해 어떤 기준을 사용할 수 있습니까? 블로그 게시물의 순위를 매기는 더 좋은 알고리즘은 무엇입니까?

+0

Google 트렌드는 매일 순 방문자수를 제공합니다. 그러나 공식 api가있는 것처럼 보이지 않습니다. 블로그 게시물에서 얼마나 효과가 있을지 잘 모르겠다. Google 검색에서 탐색하지 않을 가능성이 높기 때문이다. http://trends.google.com/websites – Danny

+0

하지만 모든 블로그 또는 블로그 게시물에 대한 데이터가 없습니다. 세계적으로 인기있는 것들만 있습니다. 내 프로젝트가 지역이 아니기 때문에이 도구는 도움이되지 않습니다. ( –

답변

2

이러한 맥락에서 용어 '인기가'내 CRITERIAS에 따라 게시물의 인기를 정의 할 모호하기 때문에 . 모든 제안 된 답변을 결합하고 블로그 게시물에 대한 합리적인 평판 시스템을 만듭니다. 예를 들어, 은 기본적으로입니다. 도메인의

  • 페이스 북의 주 × 2
  • 트위터 공유 × 3
  • 페이지 랭크 (PageRank) × 2
  • 50 000/글로벌 알렉사 평가
  • 그래서 마지막으로

에, 당신을 이 모든 것을 합하여 비교할 수 있습니다. 또한 게시물 크기, 게시물 내의 이미지 개수 등을 고려하여 몇 가지 기준을 개발할 수 있습니다.

+0

어떻게 share/likes 등을위한 곱셈 요소를 결정합니까? 왜 (Facebook share x 2)가 아니라 (Facebook share x 30) – Jayesh

+0

@Jayesh 방금 예를 들어 그들을 위해 만들었습니다. 당신에게 달려 있습니다. (당신이 중요하게 생각하는 것) – seferov

+0

감사합니다. @Ferhad 나는 거기에 도달하는 과정이 무엇인지 이해하고 싶었습니다. 임의의 가중치를 사용하여 오류를 일정 기간 동안 조정하려고 시도하거나이를 얻을 수있는 확실한 방법이 있습니까? – Jayesh

0

서로 다른 출처를 통한 공유의 공동 분포를 추정하는 것이 가능할 수 있습니다. 소외 된 (즉, 단일) 측정 항목에 대한 사기를 탐지하기는 어렵지만 전체적인 "유기적"프로필을 가짜로 만드는 것은 어렵습니다.