많은 숫자가 포함되어 있지만 대부분 0을 포함하는 희소 매트릭스 .txt 파일이 있습니다.희소 행렬 데이터를 WEKA의 arff 파일 형식으로 변환하는 방법은 무엇입니까?
0.271178 0 0 0 0 0 0 0.538776 -0.631228 -0.501485 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 : 여기 .txt 파일의 샘플은 0.438643 0 0 0 0 0.287754 0 0 0 0 0 0 0 0 0 0 -0.498918 0 0 0 0 0.475561 0 0 0 0 0 0 0 0 0 0.370479 0 -0.300765 0 -1.10987 0 0 0.163637 0 0 0 0 0 0 0.304006 0 0.181697 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.261758 0 0 0 0.153415 0.17412 0 -0.129725 0 0.17598 0 0 0 0 0 0 0.56053 0 0 -0.211302 0 0 0 0 0 0.213277 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0698458 0 0 0 0.661972 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.376654 0 0 -0.604655 0 0 0 0 0.301025 0 0 -0.431324 0 0 -0.139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0.315063 0 0 -0.285598 0 내가해야 할 일은 0 0.206607 0
이 파일을 통해 이동 WEKA's 인식 파일 형식, .arff로 데이터를 변환 할 수 있도록, 그래서 데이터 세트에 데이터 마이닝 알고리즘을 실행할 수 있습니다. 누구든지이 작업을 수행하는 방법을 알고 있습니까? 그러나 StackOverflow에서 AWK 언어로 스크립트를 사용하고 있으며 .awk 프로그램을 사용한 적이 없기 때문에 유사한 문제가있는 StackOverflow를 발견했습니다. 따라서이 프로그램을 올바르게 실행할 수 없었습니다. 다음은 그 게시물에 대한 링크입니다 : 12
출력 파일은 어떻게 생겼을 까? –