2016-06-12 2 views
0

Dell의 Statistica 소프트웨어를 사용하여 일부 데이터를 분석했습니다. 나는이 분석을 과학 논문에서 사용하고있다. 데이터 마이닝이 필자의 주요 주제가 아니지만 이전에 Data Mining 클래스를 사용했으며 일부 지식이 있습니다.Statistica의 % 75 및 % 25 데이터 샘플링 및 10 배 교차 유효성 검사는 어떻게 함께 작동합니까?

% 75 % 25 (숫자가 변경 될 수 있음) 교육 및 테스트 파트로 분리되거나 n 배 교차 유효성 검사가 모델 성능을 테스트하는 데 사용됨을 알고 있습니다.

모델을 실행하기 전에 Statistica SVM 모델링에는 구성을위한 탭이 있습니다. 데이터 샘플링 탭에서 % 75, % 25 구분을 입력하고 교차 유효성 검사 탭에서 10 배 교차 유효성 검사를 입력했습니다. 산출물에서, 나는 데이터가 실제로 훈련과 테스트로 분리되었다는 것을 안다. (모델 값은 테스트 값에 주어진다.)

교차 유효성 검사 오류가 있습니다. 아래에 결과를 복사합니다. 나는이 산출의 이해와 해석에 어려움이있다. 저와 비교해 더 나은 통계를 아는 사람 및/또는이 도구에 대해 더 많은 경험을 가진 사람이 그것이 저에게 어떻게 작용 하는지를 설명 할 수 있기를 바랍니다.

Ferda

서포트 벡터 머신 결과 SVM 유형 : 회귀 1 형 (용량 = 9.000, (ε) = 0.100) 커널 유형 : 서포트 벡터 방사형 기저 함수 (감마 = 0.053) 수 = 705 (674 제한) 교차 유효성 검사 오류 = 0.244
평균 오류 제곱 = 1.830 (열차), 0.193 (테스트), 1.267 (전체) SD 비율 = 0.952 (기차), 37076026627971.336 (테스트), 0.977 (전체) 상관 계수 = 0.314 (기차), -0.000 (테스트), 0.272 (전체)

답변

0

내가 STATISTICA 웹 사이트는 대답을 가지고 있다는 것을 발견 내 오해. 샘플링 탭에서 데이터는 학습 및 테스트 세트와 교차 검증 탭으로 구분 될 수 있습니다. 예를 들어 10을 선택하면 10 배 교차 유효성 검사를 사용하여 SVM 매개 변수와 같은 적절한 ni, 엡실론 등을 결정합니다. SVM 모델링.

이 설명은 내 문제를 해결했습니다. 비슷한 상황에 처한 사람들에게 도움이 되었기를 바랍니다.

페르다

관련 문제