2011-01-26 3 views
32

평균, SD, 왜곡 및 첨도가 알려진 R에서 분포를 생성 할 수 있습니까? 지금까지 가장 좋은 방법은 임의의 숫자를 만들어 그에 맞게 변환하는 것입니다. 적용 할 수있는 특정 배포판을 생성하는 데 적합한 패키지가있는 경우 아직 찾지 못했습니다. 감사주어진 분포, 평균, SD, 스큐 및 첨도를 R으로 생성하는 방법은 무엇입니까?

+3

으로 고유하게 분포를 설명하지 않는 지적 : 여기

은 R에서이를 구현하려고 링크입니다. 모든 모멘트를 정의하더라도 고유 한 분포를 보장 할 수는 없습니다. 당신이 정확히 무엇을하려고하는지 당신이 설명 할 필요가 있다고 생각합니다. 왜 이러는거야? 분배를 정의 할 수있는 추가 제한 사항을 적용 할 수 있습니까? – Dason

+0

아, 그렇습니다. 우리는 단일 차원에서 단일, 연속 분포를 원합니다. 최종 분포는 결국 시뮬레이션을 통해 틈새 이론의 변형을 테스트하는 방법으로 수치로 변환됩니다. –

+2

Cross Validated (stats.SE)에서 다음은 다소 관련이 있으며 독자에게 흥미가있을 수 있습니다. [특정 평균 및 표준 편차와 같은 특정 제약 조건을 충족하는 데이터를 시뮬레이트하는 방법?] (http : //stats.stackexchange .com/q/30303/7290) – gung

답변

30

는 SuppDists 패키지에서 존슨 분배있다. 존슨은 순간 또는 분위수와 일치하는 분포를 제공합니다. 다른 의견은 4 분이 배급을하지 않는다는 의견이 옳다. 그러나 존슨은 확실히 시도 할 것이다.

require(SuppDists) 

## make a weird dist with Kurtosis and Skew 
a <- rnorm(5000, 0, 2) 
b <- rnorm(1000, -2, 4) 
c <- rnorm(3000, 4, 4) 
babyGotKurtosis <- c(a, b, c) 
hist(babyGotKurtosis , freq=FALSE) 

## Fit a Johnson distribution to the data 
## TODO: Insert Johnson joke here 
parms<-JohnsonFit(babyGotKurtosis, moment="find") 

## Print out the parameters 
sJohnson(parms) 

## add the Johnson function to the histogram 
plot(function(x)dJohnson(x,parms), -20, 20, add=TRUE, col="red") 

마지막 줄거리는 다음과 같습니다 : 당신은 다른 사람들이 지적 문제의 비트를 볼 수 있습니다

enter image description here

여기

몇 가지 샘플 데이터에 존슨 피팅의 예 4 분이 어떻게 유통을 완전히 포착하지 못하는 지에 대해 알아보십시오.

행운을 빈다.

편집 해들리가 의견에 지적했듯이 존슨은 적합하지 않습니다. 나는 빠른 테스트를 수행했고 moment="quant"을 사용하여 존슨 배포판에 맞 췄고 4 분이 아닌 5 분지를 사용하여 존슨 배포판에 맞 춥니 다. 결과는 훨씬 더 잘 :

enter image description here

누구나 맞는 순간을 사용할 때 존슨은 바이어스 것 같다 왜 어떤 아이디어가 :

parms<-JohnsonFit(babyGotKurtosis, moment="quant") 
plot(function(x)dJohnson(x,parms), -20, 20, add=TRUE, col="red") 

어느 다음과 같은 생산?

+2

그 커브에 뭔가 이상한 점이 있습니다. 간단한 위치 이동으로 착용감이 훨씬 좋아졌습니다. – hadley

+0

나는 그것이 끔찍하다는 것에 동의합니다. 잠깐 시간을 내면 나는 그것을 조금 파헤 칠 수 있습니다. –

1

이러한 매개 변수는 실제로 완전히 분포를 정의하지 않습니다. 이를 위해 밀도가 필요하거나 등가 적으로 분포 함수가 필요합니다.

0

가 @Carl @ 데이비드와 다른 분포를 생성하는 여러 전용 패키지가, 상기 쓴 것처럼, 예를 들어 볼 the Probability distributions Task View on CRAN.

당신이 (지정된 파라미터로 특정 배포판에 맞는 숫자의 샘플을 그리는 방법) 이론에 관심이 있다면 그럼 그냥 예를 들어, 적절한 공식을 찾아 gamma distribution on Wiki을 참조하고 제공된 매개 변수로 간단한 품질 시스템을 구성하여 배율 및 모양을 계산하십시오.

내가 평균 및 표준 편차에 기초한 요구 베타 분포의 알파 및 베타 파라미터를 계산 here 구체적인 예를 참조.

+0

왜 내가 downvote있어? – daroczig

12

이 정말 좋은 해결책이없는 흥미로운 질문이다. 나는 다른 순간을 모를지라도 배포판의 모습을 알 수 있다고 생각합니다. 예를 들어, 그것은 단봉입니다.

가이 문제를 다루는 몇 가지 방법 :

  1. 은 기본 분포와 일치하는 순간을 가정합니다.이를 위해 많은 표준 R 패키지가 있습니다. 하나의 단점은 다 변수 일반화가 불분명 할 수 있다는 것입니다.

  2. 새들 포인트 근사치. 본 논문에서는 :

    길레스피, C.S. 및 렌쇼, E. An improved saddlepoint approximation.수학 생명 과학, 2007 년

    우리는 처음 몇 순간을 부여 할 때 PDF/PMF를 복구 봐. 우리는 왜곡이 너무 크지 않을 때이 접근법이 작동하는 것을 발견했습니다.

  3. Laguerre 확장 :

    무스타파, H. 및 Dimitrakopoulosa, R. Generalized Laguerre expansions of multivariate probability densities with moments. 컴퓨터 & 응용 프로그램을 사용한 수학, 2010.

    이 문서의 결과는 더 유망 해 보이지만 필자는이를 코딩하지 않았습니다.

3

모든 배포를 복제하려면 밀도 추정이 필요하다는 데 동의합니다. 그러나 몬테 카를로 시뮬레이션에서와 같이 수백 가지 변수가있는 경우 타협이 필요합니다.

  1. 사용하는 플레시 먼 지정된 스큐 및 첨도에 대한 계수를 얻기 위해 변환 :

    다음과 같이 접근 방식은 제안했다. 플레시 먼 스큐 및 첨도 소요하면 계수를 제공
  2. 생성 N 일반 변수 (평균 = 0, STD = 1)
  3. (2)는 플레시 먼 계수로 주어진 스큐 정상 데이터를 변환하여 데이터를 변환 및 첨도이 단계에서
  4. , 공정 (3)과 원하는 평균 및 표준 편차 (STD)를 사용 new_data로 변환 = 원하는 평균 + (3 단계에서 데이터) * 원하는 STD부터 사용 데이터

4 단계의 결과 데이터에는 원하는 평균, 표준 편차, 비대칭 및 첨도가 있습니다.

주의 사항 :

  1. 플레시 먼은 비대칭의 모든 조합에 대해 작업하고 단계 위
  2. 을 kurtois하지 않습니다가 아닌 상관 관계 변수를 가정합니다. 상관 관계가있는 데이터를 생성하려면 Fleishman 변환 이전 단계가 필요합니다.
+0

이것에 대한 R 구현이 있습니까? –

7

이 질문은 3 년 전에 요청되었으므로 저의 답변이 너무 늦지 않기를 바랍니다.

거기에 입니다. 일부 모멘트를 알고있을 때 배포판을 고유하게 식별하는 방법입니다. 그 방법은 최대 엔트로피입니다. 이 방법의 결과 분포는 분포 구조에 대한 무지를 최대화하는 분포입니다. 은 알고있는 것입니다.. 당신이 지정한 순간이지만 MaxEnt 배포본이 아닌 다른 배포판은 당신이 입력하는 것보다 더 많은 구조를 암묵적으로 가정합니다. 최대화 할 수있는 함수는 Shannon의 정보 엔트로피, $ S [x] = - \ int p (x) log p (x) dx $입니다.평균, sd, 왜도 및 첨도를 알면 분포의 첫 번째, 두 번째, 세 번째 및 네 번째 순간에 각각 제약 조건으로 해석됩니다.

문제 S에게 제약 피사체 최대화하기 위해 다음이다 : 1) $ \ INT의 XP (x)는 DX = "첫 순간"$, X^2 P (x)는 DX 2) $ \ 지능 = "두 번째 순간"$, 3) ... 등등

나는 Harte, J., Maximum Entropy and Ecology : 풍요, 유통 및 에너지 이론 (Oxford University Press, New York, 2011). " https://stats.stackexchange.com/questions/21173/max-entropy-solver-in-r

관련 문제