2014-11-14 5 views

답변

0

datasets.make_circles 함수는 매우 명확한 패턴으로 toy dataset을 만듭니다. 반환하는 데이터는 X 배열의 피쳐 (nx2 차원)와 y 배열의 레이블 (길이 n)을 포함하는 튜플입니다.

데이터를 클러스터링 스크립트에 전달하려면 비슷한 형식으로 넣고 make_circles에 의해 반환 된 값 대신 사용하면됩니다.

0

데이터를 2 차원 숫자 배열로로드하십시오. Numpy 및 Scipy의 설명서를 읽으면 현재 가지고있는 파일 형식에 따라이를 수행하는 방법을 알 수 있습니다.

클러스터링 알고리즘을 실행하기 전에 수량이 아닌 정수를 의미하는 경우 one-hot encoder을 사용하여 데이터를 전처리 할 수 ​​있습니다.

수량을 나타내는 경우 StandardScaler으로 전처리 할 수 ​​있습니다.

관련 문제