2016-12-16 2 views
-1

그래서 다양한 음악 파일의 확장 된 MFCC 값의 ".csv"파일을 생성하고 장르별로 그룹화했습니다. 장르마다 25 개의 파일이 있습니다.Scikitlearn을 사용하여 음악 장르 분류를위한 kNN 분류 자 ​​생성

각 csv 파일의 각 열은 각 프레임에 대해 12 mfccs (mfccs 1-13)를 나타냅니다. Scikit을 사용하여 모델을 만드는 법을 배우려면 어떻게해야합니까? 각 열에 대해 반복 작업을 수행 한 다음이 열을 입력 배열로 사용하고 모델을 레이블로 사용하여 장르를 교육합니까?

답변

0

미안합니다. 당신이 말했듯이 당신의 csv의 컬럼을 매트릭스 X로, 장르를 y 벡터로 가져 가야합니다. 판다는 csv를 쉽게 읽을 수있는 방법을 제공합니다. (http://pandas.pydata.org/) 그런 다음 kNN 분류자를 사용할 수 있습니다 : http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html.

분류 기준에는 데이터에 적합한 맞춤 방법과 새로운 샘플을 예측하는 예측 방법이 있습니다.

+0

나는 kNN과 함께 감독 학습을하고 싶습니다. 완전히 가능합니다. 데이터를 구조화하는 방법을 모르기 때문에 머리를 긁적 일뿐입니다. Id는 내가 언급 한 데이터를 제외하고 이와 같은 것을하고 싶습니다 : http://modelai.gettysburg.edu/2012/music/ – ohbrobig

+0

나는 kNN과 kMeans를 혼동하고 있다고 생각합니다. kMeans는 감독되지 않습니다. – ohbrobig