2009-05-15 1 views
0

, 나는 블로그 게시물의 수천을 집계 웹 사이트가 나는 가장을 파악하려면 이야기에 대해 이야기했다. MEME 알고리즘을 만드는 방법은 무엇입니까? 당신이이 문서 내 질문 밈 알고리즘을 만드는 방법입니다 <a href="http://www.readwriteweb.com/archives/news_aggregation_methods.php" rel="nofollow noreferrer">readwriteweb</a></p> <p>를 읽을 수 있습니다 무엇을 의미합니까 밈 모르는 경우

는 대부분의 뉴스에 대한 (이야기와 무엇인지 파악 에 의해 신호 대 노이즈 비율에 을 줄이려고

"밈 집계 시도 위의 기사에서이 견적을 참조하여, 희망의 ). "

누구?,이 작업을 수행하는 방법을 알고 않습니다

은 어떤 쉬운 자습서입니까?

나는 수학에 능숙하지 않기 때문에.

덕분에 당신은 가장 인기있는 주제를 찾으려면 가정

답변

0

? 실제 계산은 매우 간단 할 수 있지만 처리해야하는 데이터의 양이 많습니다.

(특정 태그/총 볼륨 블로그 게시물에 번호 블로그 포스트는) 분명히

그런 다음 가장

을 무시하는 일반적인 태그/단어 목록을 필요 태그의 인기를 = 해당 태그와 관련된 인기 게시물 = 해당 태그가 포함 된 다른 게시물에서 가장 일반적으로 링크 된 블로그 게시물입니다.

또한 정교하게 페이지 랭크 스타일 계산을 사용하여 링크의 가중치를 계산할 수 있습니다. http://www.webworkshop.net/pagerank.html - 무작위로 검색 할 때 즉, 가장 인기있는

/내 2cents

1

그런 일을 전혀 "올바른"방법이 없습니다 특정 페이지에 착륙 할 확률이 효과적으로된다. 이를 수행하는 방법에는 여러 가지가 있으며 구현/실행하고 원하는 방식으로 행동 할 수있는 것을 선택해야합니다. 당신이 이해하고 거기에서 가야 할 간단한 것을 시작하십시오. 예를 들어

:

벤 리브스는 "(특정 태그/총 볼륨 블로그 게시물에 번호 블로그 게시물)"과 페이지 랭크 (PageRank) 방식을 제안했다. 이들이 적절한 방식으로 주제를 선택하면 함께하십시오. 여기

당신은 웹 호스팅 사이트가 얼마나 인기에 따라 달라집니다 게시물에 대한 가중치를 추가 할 수

다른 몇 가지 제안입니다. 예를 들어, 뉴욕 타임즈에 게시 된 항목은 Joe Shmoes 블로그의 항목보다 더 인기가 있어야하며 더 많은 무게를 받아야합니다. 이는 페이지 순위 방식과 유사하며 실제로는 약간의 차이가있을 수 있습니다.

시간 요인을 추가하여 주제에 대한 게시물의 속도가 중요 할 수 있습니다. 예 : 주제 B에 지난 주 게시물이 30 개 있고 주제 C에 오늘부터 10 개의 게시물이있는 경우 주제 C를 더 많이 사용하는 것이 좋습니다. 주제 D에 작년 한 주에 2 개의 게시물이 있다면 어떻게 될까요? 마지막 한 시간에 5 개의 게시물이있는 주제 E는 어떻습니까?

1

변수 :

  • 카운트
  • 시간
  • 내용

콘텐츠가 발생하는 횟수를 계산합니다. 충분히 자주 발생하면 자격을 얻습니다. 최근 발생한 경우도 있습니다. 그렇지 않으면 카운트가 적절하지 않습니다. 가양 성을 피하기 위해서는 내용이 관련이 있어야합니다.

야후 문맥 검색 및 키워드 API를 먼저 살펴보십시오.

0

은 T. Segaran 그것은 소개하고 인기 순위 알고리즘을 잘 핵심 개념을 설명하고 파이썬에서 종합적인 예제를 가지고

http://shop.oreilly.com/product/9780596529321.do

에 의해 책 '집단 지성 프로그래밍'을 가져옵니다.

관련 문제