2011-09-21 2 views
4

나는 일종의 페이지 순위를 수행하는 알고리즘을 찾고 있지만, 페이지가 오래되면서 더 적은 가치를 제공합니다.만료 페이지 순위 알고리즘

내가 본 모든 알고리즘은 그 반대입니다 (이전 도메인에 더 많은 가치 부여).

그런 알고리즘을 찾는 것이 도움이 될 것입니다.

편집 : 내 초기 질문을 보면 나는 내가 묻고있는 것에 대해 약간 분명하지 않았으며 질문은 원래 생각했던 것보다 더 복잡하다고 생각합니다. 기본적으로 사이트 B가 게시물을 만든 직후 사이트 A가 사이트 B에 연결되면 사이트 B의 페이지가 추가 페이지 순위를 얻는 경우 (점수가 더 좋은 단어 일 수 있음) 일종의 순위 알고리즘이 있지만 사이트 A 게시물이 만들어진 후 오랜 시간에 사이트 B에 링크되어 있으면 페이지 순위에 거의 추가되지 않습니다.

바라건대 말이 되네. 초기 질문에 사과드립니다.

+0

시도해 보는 알고리즘을 제시하는 것이 더 좋지만 가장 오래된 날짜에서 최신 날짜로 변경할 수는 없습니다. –

+0

@SaeedAmiri : OP가 명시 적으로 그가 사용하고있는 알고리즘을 언급합니다 : pagerank. 이 문제는 명확하고이 알고리즘에 익숙한 사람에게는 잘 알려져 있습니다. – amit

+0

@amit, 나는 페이지 랭크를 안다. 그러나 약간의 변형을 가지고있다. 그리고 OP는 최신 게시물을 사용하기 위해 그것을 (작은 변화와 함께) 사용할 수없는 이유를 언급하지 않았다. –

답변

5

편향된 페이지 순위은 Haveliwala가 설명한대로 article에서 사용할 수 있습니다.

일반 무작위 요소를 사용하는 대신 [1/n,1/n,....,1/n]을 사용하는 것은 간단합니다. 편향된 임의의 구성 요소를 사용하고, 임의의 보행을 할 때 확률이 1/n 인 각 페이지로 이동하는 대신에 각 페이지로 이동하십시오. F (문서)가 새로운 페이지에 대한 높은 확률 f(doc), 그리고 컬렉션의 모든 문서에 대한 Sigma(f(doc)) = 1 [있으므로 임의의 구성 요소는 다른 융합 아니라, 각 문서에 대해 필수가 f(doc)>0 것을 [f(doc1),f(doc2),...,f(docn)]

참고가 될 것입니다 보증 [Perron-Frobenius 정리 적용되지 않습니다].


다른 가능성

일반 페이지의 순위를 산출하고, 다른 페이지마다 수치를 범 함수 g:Collection->R, 페이지가 새가 클수록 득점이 문서 중일 그것을 승산.

편집 :
원래의 질문의 편집에 대한 응답으로 : 그것을 얼마나 중요한 dentoing, 각 에지에 대한 가중치 함수를 추가
웹에 대한 그래프를 생성 할 때 또 다른 가능성은, 추가 정보 w:E->[0,1]를 추가 의미 링크가 원래 편집 직후에 만들어진 경우 w (e)는 1에 가까워지고 나중에 훨씬 더 많으면 점수는 0에 가까워집니다.

페이지 작성을 계산할 때 , 그래프에 모서리가 있음을 나타내는 간단한 이진 값 대신 Matrix[v1][v2] <- w((v1,v2))을 입력하십시오.
일단이 매트릭스가 있으면 PageRank를 정상적으로 계산하십시오.

+0

죄송합니다. 지금 종이를 읽고 이해하려고 시도하고 있습니다. 새 편집 된 질문과 관련이 있습니까? – user956400

+0

@ user956400 : 제 편집을보세요. 나는 당신의 편집 된 질문에 더 잘 맞을 것이라고 생각합니다. – amit

+0

비 이진 데이터에서 페이지 순위를 사용할 수 있다는 것을 쉽게 알지 못합니다. – user956400