2016-06-14 3 views
0

WEKA를 사용하여 MongoDB의 데이터를 학습하고 예측하려고합니다. 특히 WeKA API를 사용하여 데이터를 분석 (예 : 추천 엔진 구축)하려고합니다. 그러나 MongoDB의 데이터는 BSON 형식으로 저장되는 반면 WEKA는 ARFF 형식을 사용하기 때문에 진행 방법을 모릅니다. WEKA API를 사용하여 MongoDB에서 데이터를 읽고 분석하고 실시간으로 사용자에게 권장 사항을 제공하고자합니다. 나는 WEKA와 MongoDB의 다리를 발견 할 수 없다.MongoDB에서 Weka API를 작동시키는 방법은 무엇입니까?

다른 방법을 시도해도 될까요?

+0

이 링크는 프로그래밍 방식으로 자신의 .arff 파일을 정의하는 좋은 예입니다. https://wekispaces.com/Programmatic+Use – Walter

+0

mongodb jdbc 또는 odbc 드라이버를 사용하여 weka의 MongoDB 데이터에 액세스하는 것을 고려 했습니까? – user6641561

답변

0

시작하기 전에 WEKA가 빅 데이터 작업을위한 최상의 도구는 아니라고 말해야합니다. Big Data가 실제로있는 경우 분석에 더 적합하기 때문에 Spark과 Hadoop 패밀리를 사용하고 싶을 것입니다.

질문에 대한 답변을 작성하려면 수동으로 (즉, 프로그래밍 도구를 사용하여 교육 파일을 작성하여) 사전 교육을 해보는 것이 좋습니다. 그런 다음 이러한 모델을 저장하고 그에 따라 프로그램에 통합 할 수 있습니다.

테스트의 경우에는 official instructions을 따라갈 수 있지만 일반적으로 약간의 단축키가 필요합니다. 일반적으로 데이터를 CSV와 같은 형식으로 사전 처리 (ARFF 파일로 이동하는 것처럼)하고 유효한 ARFF 헤더 (귀하의 교육 파일과 동일한 헤더). 거기에서 인스턴스를 테스트하는 것이 매우 쉽습니다. 필자가 경험 한 바에 따르면 이것은 실제로 새로운 예측을하는 코드를 작성하는 프로세스를 크게 단순화합니다.

+0

도움을 주셔서 대단히 감사합니다! 나는 당신의 아이디어처럼 Weka를 사용하는 것에 대해 생각했습니다. 하지만 저는 스파크를 공부하려고 노력할 것입니다! 그것이 더 나은 선택이라면, 나는 그것을 나의 프로젝트로 가져갈 것이다! 많은 감사! :) – Duong

관련 문제