2017-12-21 5 views
-1

이 데이터 세트를 사용하여 Apache Spark 2.1.1에서 여러 ML 모델을 학습 할 수 있습니다. 이 열은 10 개의 열로 구성되며 그 중 2 개의 열에는 문자열이 포함됩니다. 이러한 열을 제거하는 것은 내가 수집하고자하는 정보에 중요하므로 옵션이 아닙니다. 그러나이 문제로 인해 실험을 진행하기 위해 CSV 파일을 SVM으로 변환 할 수 없습니다.CSV 파일을 ML 교육용 SVM으로 변환하는 방법

성공적으로 RDD로 변환하려고했지만 SVM으로 저장했지만 파일이 저장되지 않습니다. 이것 주위에 다른 방법이 있습니까?

답변

0

관심있는 두 열에 문자열 두 개를 만들고 문자열 값을 사용하는 대신 인덱스를 사용하여 모델을 학습 할 수 있습니다.

관련 문제