2011-10-07 3 views
2

안녕하세요 저는 시뮬레이션을 통해 출력 된 데이터를 분석하기 위해 R을 사용하고 있습니다. 내가 PDF를 생성 할 HIST 기능을 사용하고있어 내가주는 정확한 명령을 내 이해에서확률 분포 함수 생성 문제 (PDF) R

hist(data_delay$delay,freq=F) 

는 차트의 y 축 1 다음 작아야 값은 Y 축에있는 모든 수는 1 개까지 추가한다 하지만 불행히도 저는 Y-Axis에서 임의의 범위를 얻지 못합니다. 때로는 1000의 값을가집니다.

샘플 입력 파일을 첨부하고 있습니다. 여기에서 Y 축 값은 0에서 100 사이의 값입니다.

제공 할 수있는 모든 도움에 감사드립니다. freq=FALSE는 "히스토그램 하나의 전체 면적이있다"는 hist 설명서에 따라 http://www.mediafire.com/?twyoseg8bai0dr7

답변

10

다음과 같이

내 데이터이다. 모든 막대의 높이가 1보다 작아야한다는 것은 아닙니다. 명령 및 데이터로 만든 히스토그램은 휴식 떨어져 0.005 동일한 간격입니다 1.

> data_delay <- read.csv("PATH_TO_DATA_FILE") 
> h <- hist(data_delay$delay, plot=F) 
> h 
$breaks 
[1] 0.000 0.005 0.010 0.015 0.020 0.025 0.030 0.035 0.040 0.045 0.050 0.055 
[13] 0.060 0.065 0.070 

[SNIP] 

$density 
[1] 112.47892074 13.36706015 3.91231029 5.98088814 10.35413153 
[6] 11.21978640 11.80438449 6.55424396 14.14277684 2.63069140 
[11] 5.53119730 1.31534570 0.69702080 0.01124227 

[SNIP] 

의 전체 면적이 있는가, 그래서 우리는 다음을 수행하여 히스토그램의 전체 영역을 볼 수 있습니다.

> sum(h$density * 0.005) 
[1] 1 
1

당신이 선호 할 수 foo<-density(rnorm(1000)) ; plot(foo)

+1

이 좋을 수도 있지만 (수와 밀도 사이의 혼란을 기반으로) 영업 이익의 문제가 해결되지 않습니다 같이 ?density