2013-10-09 1 views
0

나는 명령을 사용 :Boxplot 주요 직사각형 데이터 포인트의 백분율?

boxplot(V15~Class,data=trainData, main="V15 value depending on Class", xlab="Class", ylab="V15") 
나는 사각형 (들) 포인트 백분율 인 이해하려는

?

enter image description here

는 말 : 내가 주 사각형 내부의 모든 샘플을 채취하는 경우,이 시료의 총 수의 비율 될 것인가?

나는 documentation을 찾았지만이 대답을 알아낼 수 없습니다.

+1

질문을 올바르게 이해할 수 있을지 확신 할 수 없지만, 4 분위수는 일반적으로 상자의 크기를 정의하기 때문에 대답은 "50 %"이어야한다고 생각합니다. 즉 관측치의 25 %가 항상 상자 위와 아래에 있어야합니다. – texb

+0

@ textext Ok; 설명서 어디서나 볼 수 있습니까? – tucson

+0

필자는 실제로이 함수의 작성자가 박스 플롯이 충분히 표준화되어 있다고 가정합니다. 실제로 다른 구현 패키지의 위스커 정의가 다를 수 있지만 구현의 흥미로운 기능은 아닙니다. – texb

답변

2

참조하는 help text for boxplot은 "이어야합니다"참조boxplot.stats 계산을 수행합니다. "세부 사항"섹션에서 :

The two ‘hinges’ are versions of the first and third quartile, i.e., close to quantile(x, c(1,3)/4). 
The hinges equal the quartiles for odd n (where n <- length(x)) and differ for even n. 
Whereas the quartiles only equal observations for n %% 4 == 1 (n = 1 mod 4), 
the hinges do so additionally for n %% 4 == 2 (n = 2 mod 4), and are in the middle of two observations otherwise. 

그래서 네, 기본적으로 값의 중간 50 %는 상자 안에 가을,하지만 계산의 세부 사항은 데이터의 특성에 따라 달라집니다.

관련 문제