2017-11-30 3 views
0

예를 들어 AB 테스트에서 A 모집단은 1000 개의 데이터 포인트를 가질 수 있으며 그 중 100 개가 성공합니다. B는 2000 데이터 포인트와 220 성공을 가질 수 있습니다. 이것은 A에 성공 비례 0.1과 B 0.11을주고, 그 델타는 0.01입니다. 어떻게이 델타 주위의 신뢰 구간을 파이썬으로 계산할 수 있습니까?Python에서 두 비율의 차이에 대한 신뢰 간격

통계 모델은 하나의 샘플에 대해이 작업을 수행 할 수 있지만 AB 테스트에 필요한 것처럼 두 샘플 간의 차이를 처리하는 패키지가없는 것처럼 보입니다. (http://www.statsmodels.org/dev/generated/statsmodels.stats.proportion.proportion_confint.html)

+0

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.ttest_ind.html 또는 https://stackoverflow.com/questions/752919/any-thoughts-on -ab-testing-in-django-based-project ...? – Dadep

+0

이것은 비정상적인 패러다임입니다. 종종 두 집단이 비교 될 때 그들의 성공 확률은 동일 할 것이라는 가설이 가장 자주 나타납니다. 이 신뢰 구간으로부터 다음은 p = 0 주위에서 계산 될 것이다. 이것은 당신이 여기서 어떤 대답도 얻지 못하는 이유 일 수 있습니다. –

답변

0

샘플 크기가 같지 않아도됩니다. 두 비율에 대한 신뢰 구간은 enter image description here

p1 및 p2는 각각의 샘플 n1 및 n2에 대해 계산 된 관측 확률입니다.

자세한 내용은 this white paper을 참조하십시오.

+0

나는 이것이 질문에 대답하지 않는다고 생각한다. 그 논문의 저자는 "전체 인구에서 p2와 p1의 차이의 크기에 대해서는 아무런 주장도하지 않는다. 단지 존재한다는 것"이라고 말한다. 질문은 0이 아닌 0.11의 신뢰 구간을 구성하는 것에 관한 것입니다. –

+0

그 점이 궁금하다면, 귀무 가설은 무엇입니까? –

+0

나는 (보통) 이론이 적용되지 않는다고 생각합니다. 샘플을 가져 와서 샘플 비율의 차이를 계산 한 다음 샘플을 가져 오기 전에 그 차이가 0.11이라고 테스트 한 것처럼 가장 할 수는 없습니다. 그것은 스포츠가 아닙니다. –

관련 문제