2014-03-28 7 views

답변

0

교차 유효성 검사의 목적은 보이지 않는 데이터가 표시 될 때 모델이 생성하는 성능에 대한 예측을 출력하는 것입니다.

10 배의 경우, 데이터는 10 개의 파티션으로 분할됩니다. 교육 세트를 만들기 위해 데이터의 9/10을 얻는 10 가지 방법이 있으며이 모델을 사용하여 10 가지 모델을 만들 수 있습니다. 이 모델은 성능 추정치를 산출하기 위해 나머지 1 파티션에 적용됩니다. 10 개의 공연은 평균입니다. 최종 결과는 보이지 않는 데이터에서 모델의 성능을 합리적으로 추정 한 평균값입니다.

나머지 질문은 모델이 무엇입니까? 가장 좋은 대답은 모든 데이터를 기반으로 만들어진 모델을 사용하고 평균 추정치를 생성하는 데 사용 된 10 개의 모델에 충분히 가깝다고 가정하는 것입니다.

관련 문제