2016-07-10 3 views
0

WEKA를 분류에 사용하고 있습니다. Java 코드에서 WEKA jar 파일을 사용하고 있습니다. 내 훈련 datset 56000 인스턴스와 1253 기능이 있습니다. 로지스틱 회귀, J48, 랜덤 포레스트 랜덤 트리 등의 간단한 분류 알고리즘을 사용하고 있습니다. 랜덤 포레스트에 대해서만 결과를 얻을 수 있습니다. 다른 분류 프로그램에 대한 교육 모델을 작성하는 동안 내 프로그램은 6 ~ 7 시간 동안 계속 실행되었지만 어떤 결과 나 오류도 발생하지 않았습니다.대형 트레이닝 데이터 세트 (Java 코드)

대형 데이터 세트에서 WEKA 분류기를 훈련하는 방법을 제안 할 수 있습니까?

감사합니다.

답변

3

weka의 기계 학습 알고리즘 구현은 전체 데이터 세트를 메인 메모리에로드하므로 언젠가 모델을 학습하는 데 많은 시간이 걸릴 수 있습니다. 명령 행을 통해 Weka를 사용하면이 점에 도움이 될 수 있습니다. 또한 훈련 시간을 줄일 수있는 몇 가지 다른 방법이 있습니다. 그들은 http://www.cs.waikato.ac.nz/ml/weka/bigdata.html

에 입대했습니다.

관련 문제