2010-04-20 10 views
1

이 사이트에 대해 적절한 질문이 아닌 경우 유감스럽게 생각하며 필요한 경우이 질문을 닫습니다. 내가 계층 구조를 만들 수있는 더 복잡한 인덱스를 찾기 위해 노력하고있어더 복잡한 색인이 필요합니까?

:하지만 어쩌면 누군가가 나에게 ideea의를 줄 수 있습니다. 예를 들어 6 = 83 %에서

표 5, 600 = 83 %에서

500 표; 600

10 표 = 1.66 %는

나는 %로 계층 구조를 만들 경우, 먼저 두 사람은 같은 장소에있을 것입니다,하지만 난 83 % (600)에서이 첫 번째보다 더 가치 있다고 생각합니다.

나는 3 번째 케이스 (10 표)가 첫 번째 경우 (5 표) 앞에 놓이기 때문에 공정하지 않다. 3 번째 경우에는 1.66 만있다. %

아마 누군가가 나에게 어떻게 두 번째 경우에 더 많은 가중치를 부여하는 ideea의를 제공하지만 같은 시간에 새로운 항목이 공정한 기회를 가질 수 있도록 할 수 있습니다.

답변

2

이것은 베이지안 솔루션을 호출하는 표준 문제입니다. 관찰에 대한 투표의 비율에 대한 사후 평균에 관심이 있습니다.

가장 간단한 방법은 Binomial 분포에서 오는 투표 수를 모델링하고 매개 변수 alpha 및 beta로 공액 Beta을 먼저 지정하는 것입니다. 이것은 사후 평균 = (votes + alpha)/(n + alpha + beta)로 이어진다. 평범한 평균에 비해 평균이 더 커지면 알파와 베타가 얼마나 큰지 알 수 있습니다.

더 좋은 방법은 데이터의 계층 적 모델과 추정 알파와 베타를 설정하는 것입니다. 일치하는 순간은 베이지안이 완전히 아니더라도 잘 작동합니다. 이 문제는 Gelman et al.의 쥐 예와 같은 형태이다. (2003); Bolstad (2004)는 또한 Binomial 모델에 대한 장을 가지고있다. here, herehere을 참조하십시오.

+0

@Tristan 제안 해 주셔서 감사합니다. 나는 그것들을 보았지만 문제는이 쿼리가 매 10 초마다 만들어 져야 할 것이므로 매우 빠르고 싶다. 나는 y/t * 100 * 0.3 + y/T * 100 * 0.7과 같은 것을 생각하고있다. y = serie의 요소; t = 모든 요소 그리고 나서 첫 번째 인덱스에 대한 30 % (0.3) 및 70 %의 가중치를 준 용 Y (POZ 및 네거티브) T = pozitives 투표의 총 수에 대한 투표의 총 수 (0.7) 두 번째. 당신은 어떻게 생각하십니까? – silversky

+0

시뮬레이션에서 매우 불일치 한 값을 갖는 12 개의 요소가 있습니다. 결과는 다음과 같습니다. case 1 : 25.02; 사례 2 : 27.40; 사례 3 : 0.54; 사례 4 (5000에서 6000 = 83 %) : 49.04 – silversky

+0

빠르고 쉽게 원하는 경우 알파와 베타를 적당한 것으로 수정하고 p = (alpha + votes)/(alpha + beta + n)을 계산하십시오. 데이터가 없으면 p = alpha/(alpha + beta)입니다. 수많은 데이터가 있으면, 알파와 베타가 작기 때문에 p = votes/n입니다. 알파를 가짜 투표로, (알파 + 베타)를 가짜 총으로 생각할 수 있습니다. 베타 배포판을보고 p 분포에 대해 생각하거나 관찰하는 것과 일치하는 합리적인 알파와 베타를 선택하십시오. 다른 아이디어를 시도해 볼 수도 있지만 이것은 실제로 올바른 통계적 접근 방법입니다. – Tristan

0

는 비율을 비교하고 동일 (또는 동등에 가까운) 때, 투표 수를 비교하여 무승부를 해결.

+0

나는 내가 diference이 5 %의 한계에 그래서의 (601) = 81,5 %에서 490 투표 5 %를 가정 해 봅시다 받아 들인다면 때문에 예를 들어 일을하고 내가 계층 구조를 만들 수 있습니다 경우 것이라고 생각하지 않습니다 총 투표 수는이 마지막 사례가 500에서 500의 앞에있을 것입니다. = 83 % – silversky

+0

490에서 500을 비교하는 것은 어떻습니까? 총 투표 수를 비교하지 마십시오. 투표 수는 백분율로 계산됩니다. – Kaniu

+0

나는 이것도 생각했다. 그러나 우리가 이전 예제를 610 = 82 %에서 대체하고 다시 600 = 83 %에서 두 번째 경우 500보다 높기 때문에 효과가 있다고 생각하지 않는다. – silversky

관련 문제