저는 Mahout에서 새삼입니다. Mahout tranpose 명령 행을 사용하여 행렬을 조 변경하려고합니다.Mahout 전치 행렬
내 데이터 원본 파일의 모든 줄은 다음과 같습니다. 1;456;789;012;.... .
키는 각 줄의 첫 번째 요소입니다 (이 예제에서는 "1"입니다). 모든 행은 행렬의 벡터입니다.
","또는 ""공백으로 구분 기호를 변경하려고했지만 작동하지 않습니다.
mahout seq2sparse -i /test/myfile_seq/chunk-0 -o /test/myfile_vector
:
mahout seqdirectory -c utf-8 -i /test/myfile -p /test/myfile_seq
그럼 내가이 명령을 사용하여 벡터로 내 시퀀스 파일을 변환하려고 :
이 행렬을 전치려면,이 명령을 사용하여 시퀀스 파일 내 HDFS 데이터 파일을 변환 시작 내가 가진
sudo -u hdfs mahout transpose --input /test/myfile_vector//tfidf-vectors/part-r-00000 --numRows 5 --numCols 24
:
그럼 내가이 명령을 사용 tranpose하기 몇 가지 질문 :
- What is the separator to use in the data file source - What should be the output of the "mahout seqdirectory" command? - Did I need to convert my sequence file to vectors to transpose?