2017-09-10 2 views
1

저는 파이썬에서 pandas 라이브러리로 작업하고 있습니다. 각 신뢰 구간의 경우다중 신뢰 구간

mean_value=df.mean(axis=1) 
std_value=df.std(axis=1,ddof=0) 
lower_bound=mean_value-1.96*std_value 
upper_bound=mean_value+1.96*std_value 
diff = upper_bound-lower_bound 

:

나는이 각 시료에 대한 95 % 신뢰 구간을 얻으려면
np.random.seed(12345) 

df = pd.DataFrame([np.random.normal(32000,20000,3650), 
        np.random.normal(43000,10000,3650), 
        np.random.normal(43500,14000,3650), 
        np.random.normal(48000,7000,3650)], 
        index=[1992,1993,1994,1995]) 

은 내가 계산 : 나는 다음과 같은 방법으로 정규 분포에서 가져온 네 개의 무작위 샘플이 있다고 가정 , 나는 균등 간격 간격으로 11 개로 자르고 싶다. 나는 다음과 같은 생각을했다 :

low=lower_bound.values[1] 
high=upper_bound.values[1] 
diff=0.09*diff.values[1] 
np.arange(low,high,diff) 

이하지 않습니다 잘 작동, 절단 간격이 신뢰 구간의 상단에 종료하지 않는 한. 균등 간격 간격을 얻으려면 어떻게해야합니까?

+2

은 [계산 샘플 데이터로부터 신뢰 구간 (https://stackoverflow.com/questions/15033511/compute-a-confidence-interval-from-sample-data)의 사용 가능한 복제는 – MaxU

+0

내가 편집 한 중복을 제거하는 질문. – user21359

답변

2

정확히 무엇을 원하는지 잘 모르겠지만 NumPy의 linspace 기능으로 일정 간격으로 간격을 확보하는 것은 매우 쉽습니다. 첫 번째 배포에 대한 11 개의 간격이 있습니다.

np.linspace(lower_bound.values[0], upper_bound.values[0], 12) 
array([ -7.18705879e+03, -3.82825067e+01, 7.11049377e+03, 
     1.42592701e+04, 2.14080463e+04, 2.85568226e+04, 
     3.57055989e+04, 4.28543752e+04, 5.00031514e+04, 
     5.71519277e+04, 6.43007040e+04, 7.14494803e+04])