0

일부 프로젝트를 진행하고 있으며 데이터 파일을 사용하여 모델을 교육해야합니다. 문제는 모델 교육에 사용될 데이터 파일의 크기가 10 기가라는 것입니다. 따라서 한 번에 데이터를 가져올 수 없습니다. 다른 방법으로는 데이터를 잘라 내고 훈련 데이터의 5 % 만 사용하십시오. 그러나 나는 약간의 정보를 잃을지도 모른다. 제 질문은 "파일을 여러 파일로 분할하여 모델을 교육 할 수 있습니까?"입니다.RapidMiner를 사용하여 여러 파일에서 모델 교육

+0

아마도 * 프로그래밍 * 웹 사이트가 아닌 ** rapidminer 포럼 **에이 질문을 게시해야 할 것입니다. 왜냐하면 프로그래밍에 관한 것이 아니라 프로그램 인 rapidminer를 사용하기 때문입니다. –

답변

0

Update Model 연산자를 사용하여 이전에 만든 모델을 새 예제 세트 데이터로 업데이트 할 수 있습니다. Naive Bayes와 k-NN은 Weka의 W-IBk와 마찬가지로 모든 모델 연산자를 사용할 수 있습니다.

RapidMiner에서 프로세스를 생성하여 파일을 작은 조각으로 나누고 하나씩 읽고 모델을 생성 할 수 있습니다.

관련 문제