2014-12-25 2 views
0

WEKA 교차 검증 :교차 검증 WEKA 임의

Classifier cls = new J48(); 
Evaluation eval = new Evaluation(data); 
Random rand = new Random(1); // using seed = 1 
int folds = 10; 
eval.crossValidateModel(cls, data, folds, rand); 
System.out.println(eval.toSummaryString()); 

는 "랜드"는 무엇을 의미합니까? 이 경우 상호 유효성 검사는 어떤 방식으로 수행됩니까? 10 배는 항상 섞여 있습니까?

감사합니다.

답변

1

"랜드"란 무엇입니까?

랜드는 데이터 세트를 무작위로 생성하는 객체 인스턴스입니다. 이것은 교차 유효성 확인을 위해 사용됩니다. 시드는 임의성의 구성 요소입니다.

이 경우 교차 검증은 어떻게됩니까?

데이터 세트가 혼합되어 예를 들어 데이터 행 (1-100)이 순서대로있는 경우 데이터가 무작위로 선택되어 처음 5 개는 (77,12,4,7,55) (1,2,3,4,5) 대신

항상 10 배가 섞여 있습니까?

사용하는 도구 나 라이브러리에 따라 다르지만 WEKA에서는 그렇게 생각하지 않습니다. 나는 그것이 단지 1-10을 가지고 있고 그것을 세트 11-20으로 만들고 그것이 세트라고 생각한다. 특히 파일에 그룹화 된 데이터가 유사한 특성을 갖는 경우 바이어스가 발생합니다. 이것이 데이터가 무작위로 추출되는 이유입니다.

관련 문제