2012-11-02 1 views
0

xdmp : document-insert()에 대해 포리스트를 선택하는 데 사용되는 알고리즘과 포리스트간에 문서 배포에 영향을주는 요소는 무엇입니까?xdmp : 포리스트간에 document-insert() 문서 배포

xdmp : document-insert가 문서를 똑같이 배포하지 않습니다. 나는 cts : uris의 출력을 xdmp : document-assign에 전달한 다음 key = forest-name 및 value = uris count와 함께 맵을 채 웁니다.

하자 $ 지수 : = xdmp : 문서 할당 ($의 URI, $ 숲 카운트) 하자 $ 숲 이름 : = xdmp : 숲 이름 ($ 숲 [$ 지수])

$ 숲 수는 낮으며, 문서는 숲 전체에서 균형을 이루지 만, 그렇지 않은 경우에도 균형을 유지합니다. 의 숲이 많아 (50 세 이하) 높은 분포를 보이고있다.

답변

1

알고리즘은 64 비트 해시를 사용하므로 50 개 이상의 포리스트에 충분한 주소 공간이 있습니다. 수백 개의 포리스트 (아마도 수천)가있는 배포 된 클러스터가 있습니다. 함께 작업하는 클러스터에서 문서 수는 일반적으로 평균의 10 % 이내입니다. 대부분의 포리스트 작업이 O(log n)이기 때문에 충분히 균일합니다.

게재 위치는 URI 자체가 균등하게 분포 될 때 가장 잘 작동하는 경향이 있습니다. 예를 들어, 순차 번호 인 URI가 더 많이 뭉칠 수 있습니다.