2012-07-18 2 views
0

Cloudera 데모 VM에서 Mahout을 실험 해본 결과 샘플 합성 제어 데이터 (https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control)가 성공적으로 클러스터링되었습니다. k-Means 알고리즘을 사용하여). ClusterDumper를 사용하여 Mahout 출력을 볼 수 있지만 출력을 Hive 테이블에 저장하려고합니다. 이 일을 어떻게 하죠?클러스터 된 데이터를 HDFS에서 하이브로 이동

답변

1

직접 통합은 없습니다. 가장 좋은 방법은 ClusterDumper를 수정하여 테이블 형식의 데이터로 하이브로 가져올 수있는 일종의 텍스트 표현을 생성하는 것입니다.

0

Mahout o/p 경로를 가리켜 야하는 외부 테이블을 하이브에 작성하십시오.