누구나 다음을 수행하는 가장 좋은 방법을 조언 해 주시겠습니까?무작위로 데이터의 하위 집합을 선택하여 평균 수준이 벗어나는 곳을 확인하십시오.
나는 세 개의 변수 (X, Y & Z)와 네 개의 그룹 (1, 2, 3 & 4)을 가지고 있습니다. 나는 SPSS에서 discriminant function analysis를 사용하여 알려진 그룹화 된 데이터의 그룹 멤버십을 예측하여 그룹화되지 않은 미래의 데이터에 사용하도록했습니다.
이상적으로 원하는 데이터의 하위 집합을 무작위로 샘플링하여 원하는 정확한 분류 비율을 맞추기 위해 얼마나 많은 관찰이 필요한지 알고 싶습니다.
그러나 이것은 어렵다고 생각합니다. 그러므로, 나는 이것을 위해 수단을 찾고있다.
예를 들어, 변수 X는 그룹 1에 대해 141의 평균을 갖습니다.이 평균은 2000 회의 관측치로부터 계산되었을 수 있습니다. 그러나 평균이 700 번 관측에서 발생했을 수도 있습니다. 나는 관측치/사례의 수를 내 데이터의 평균 수준으로 계산할 수 있기를 원합니다. 예를 들어, 아마도 10 번 관측에서 시작하여 이것을 무작위로 50 번 또는 100 번 반복 한 다음 20 번 관측으로 증가시키는 등 .... 등등.
나는 이것이 몬테카를로 테스트의 한 형태라는 것을 알고 있습니다. 나는 SPSS 15, 17 및 18에 접근 할 수 있으며 탁월하다. 또한 minitab 15 & 16 및 amos17에 액세스 할 수 있으며 "R"을 다운로드했지만 이것에 익숙하지 않습니다. 내 경험은 SPSS와 함께하며 탁월합니다. SPSS Modified from this ..http : //pages.infinit.net/rlevesqu/Syntax/RandomSampling/Select2CasesFromEachGroup.txt에서 구문을 시험해 보았습니다.하지만 이것은 여전히 부분 집합의 숫자를 입력하는 데 꽤 많은 시간이 걸릴 것입니다.
희망 사항이 도움이 될 수 있습니다.
읽어 주셔서 감사합니다.
앤디
R은 이런 종류의 일을하기에 꽤 좋습니다. 당신이 미래에 이런 종류의 일을 더 많이하게된다면, 그것을 사용하는 법을 배울 가치가 있습니다. R을 사용했다면 작은 그룹에서 큰 그룹까지 무작위로 무작위로 추출한 다음 그 평균을 계산할 것입니다. 그런 다음 평균/부분 집합 크기의 그래프에 모두 그려 넣은 다음 모든 것이 수렴되는지 확인하십시오. 이 프로그램의 구현은 실제 프로그래밍 언어에서는 매우 간단하지만 엑셀과 같은 프로그램에서는 어렵습니다. – Oliver