2013-03-23 1 views
2

저는 R이 처음이에요. 목표와 함께 샘플 세트를 가지고, 새 샘플의 목표를 해결하기 위해 숫자 함수를 맞추고 싶습니다. 내 샘플이 장소에서 사용자의 체류 기간을 나타내는 시간 (초)입니다 : 첫째샘플 세트를 사용하여 새로운 값 보간

>b <- c(101,25711,13451,19442,26,3083,133,184,4403,9713,6918,10056,12201,10624,14984,5241, 
+21619,44285,3262,2115,1822,11291,3243,12989,3607,12882,4462,11553,7596,2926,12955, 
+1832,3539,6897,13571,16668,813,1824,10304,2508,1493,4407,7820,507,15866,7442,7738, 
+5705,2869,10137,11276,12884,11298,...) 

, 나는 3600로 나누어 시간으로 변환, 나는 시간의 PDF로 기능에 맞게 원하는 :

나는 그림에서 빨간 선에 맞게,이 장소에서 특정 기간의 가능성을 찾아 새 값을 보간 할
> b <- b/3600 
> hist(c,xlim=c(0,13),prob=T,breaks=seq(0,24,by=0.5)) 
> lines(density(x), col=red) 

enter image description here

는 P (기간 = 1.5hours)를 말한다.

감사합니다.

+0

배포본의 가능성 함수를 알고있는 경우'MASS : fitdistr' 또는'optim'을 사용해보십시오. –

+1

... 단일 점에서의 확률 밀도가 0이라는 점에 유의해야합니다. 즉,'p (duration <1.6 and duration> 1.4)'영역을 정의해야합니다. –

+0

'밀도'를 사용하지 않는 이유는 무엇입니까? dd <- density (b); sum (dd $ y [dd $ x <1.5])/sum (dd $ y)' – agstudy

답변

2

위에서 제안한대로 fitdistr의 분포를 MASS 패키지에 넣을 수 있습니다. 연속 분포를 사용하면 시간이 일정한 간격 내에있을 확률을 갖게됩니다. 이산 분포를 사용하는 경우 특정 시간 (시간)의 확률을 계산할 수 있습니다.

연속적인 경우 감마 분포를 사용할 수 있습니다. fitdistr(b, "Gamma")을 사용하면 매개 변수 추정치가 제공되고 pgamma을 추정치 및 간격과 함께 사용할 수 있습니다.

이산 케이스의 경우 포아송 분포 : fitdistr(b, "Poisson")dpois 함수를 사용하여 원하는 예상 값과 값을 사용할 수 있습니다.

어느 것을 사용할 지 결정하려면 히스토그램을 사용하여 pdf를 플롯하고 살펴보십시오.

+0

여기서주의하십시오 ... 왜 감마 분포를 선택합니까? 그의 밀도는 무엇이든 될 수 있습니다. 더 많은 지식이 없으면 커널이나 히스토그램을 사용하여 비 파라 메트릭 밀도 추정을 제안합니다. –

+0

예. 나는 그가 제공 한 히스토그램을보고 감마를 말했다. 물론 고려해야 할 것이지만, 나는 그것이 무엇이 옳은지 결정하는 것이 그에게 달려 있다고 생각합니다. –

관련 문제