먼저 통계를 집중적으로 다루는 포럼에 게시해야하는 정확한 위치인지 여부는 확실하지 않습니다. 그러나 이것을 R로 구현하려고 할 때 여기에 게시하는 것이 가장 좋을 것이라고 생각했습니다. 내가 틀렸다면 사과하십시오.R - 커널 밀도 추정에서 얻은 확률 밀도 분포에 대한 데이터를 시뮬레이트합니다.
그럼 제가하려는 것은 다음과 같습니다. 전체 250.000 개의 관측치에 대한 데이터를 시뮬레이트하고 경험적인 데이터 (불연속)에서 파생 된 커널 밀도 추정치와 함께 연속 (비 정수) 값을 할당합니다. 원래 값은 -5에서 +5까지입니다. 다음은 내가 사용하고자하는 배포본입니다.
그것은 값이 2.89이 아닌 3이 말을 할 수있는 정말 중요한 나는 이산 확률을 기반으로 새로운 데이터가 아니라 연속 사람을 시뮬레이션하지 않는 것이 나에게 매우 중요합니다 따라서 새로운 값은 플롯에 묘사 된 확률에 따라 지정됩니다. 시뮬레이션 된 데이터에서 가장 빈번한 값은 +2 주위에 있고, -4와 +5 주변의 값은 다소 드뭅니다.
R에서 데이터를 시뮬레이션 할 때와 커널 밀도 추정이 작동하는 방법에 대해 상당히 많은 내용을 읽었지만 실제로 전진하지는 않습니다. 그래서 내 질문은 기본적으로 두 단계를 수반합니다 - 어떻게 데이터를 시뮬레이트합니까 (1), 게다가이 특정 확률 분포 (2)를 사용하여 데이터를 어떻게 시뮬레이트합니까?
미리 감사드립니다. 저와 함께 도와주세요.
질문을 이해한다면 아마도 몬테카를로 시뮬레이션을 사용할 수 있습니다. 배포본이 알려지기 때문에, 그 배포본의 무작위 샘플링을 사용하여 시뮬레이션 된 데이터를 생성 할 수 있습니다. 그게 당신이하려고하는 것처럼 들리니? –
안녕하세요 @LloydChristmas, 답장을 보내 주셔서 감사합니다. 분배가 알려져 있지만 실제 이산 분포를 사용하여 데이터를 시뮬레이트하고 싶지는 않지만 커널에 표시된 연속적인 분포를 사용하고 싶습니다. 그것이 당신이 말하는 것 인 경우, 이것은 굉장 할 것입니다. 내가 어떻게 해? – nikUoM
여기에 몇 가지 흥미로운 토론이 있습니다 : http://stats.stackexchange.com/questions/30303/how-to-simulate-data-that-satisfy-specific-constraints-such-as-having-specific-m –