2012-07-13 8 views
5

공개 데이터 세트에서 내 음악 장르 알고리즘을 테스트하여 다른 기존 알고리즘과 비교하려고합니다. MIREX의 경우 모든 데이터를 사용할 수 없습니다. GTZAN 데이터 세트가 링크 (marsyas.info/download/data_sets)에서 사용 가능하다는 것을 알게되었습니다. 하지만 지금은 사용할 수 없습니다.GTZAN 음악 장르 데이터 세트

이 데이터를 얻으려면 어떻게해야합니까? MFCC보다 다른 기능을 사용하기 때문에 장르에 대한 주석과 음악이 필요합니다.

미리 감사드립니다.

답변

1

나는 또한 이러한 벤치 마크를 찾고 있습니다.
I라는 종이에이를 찾아 "소리에 '센스'에서 특징 추출 및 기계 학습을 통해 - 특성화 음악에 대한 높은 수준의 기술자를 도출"

현재 음악에서 수행되는 몇 가지 노력이있다 정보 검색 커뮤니티 의 큰 저장소를 컴파일하여 모든 관심있는 연구원이 사용할 수 있도록 저작권을 설정합니다. 저작권 문제가 없습니다. 주목할만한 예로 Masataka Goto의 RWC Music Database (http://staff.aist.go.jp/m.goto/RWC-MDB), IMIRSEL (국제 음악 정보 검색 시스템 평가 실험실) 프로젝트 일리노이 대학교 어 바나 - 샴페인 (http://www.music-ir.org/evaluation- 또한 [12] 참조) 및 새로운 FreeSound Initiative (http://freesound.iua.upf.edu) .

그러나 유용한 정보는 없습니다. 첫 번째 언급 된 데이터베이스의 복사본을 얻는 절차는 here이지만 꽤 정교 해 보입니다.

1

Echonest와 Labrosa가 발표 한 오디오 기능, 태그, 가사 등을 포함한 수백만 곡의 노래가있는 Million Songs Dataset을 원하는 것처럼 들릴 수 있습니다. 물론 이것은 음악 메타 데이터 및 대본에서 작업하고 있다고 가정합니다.

원시 오디오를 찾고 있다면 ... 그건 또 다른 문제입니다. 지적 재산권 법이 더 중요한 요소가 될 수있는 경우 공개할지 여부는 알 수 없습니다. 하지만 개인적인 테스트를 위해 자신의 음악 라이브러리에있는 파일 (예 : iTunes 다운로드에 이미 알고리즘을 테스트하는 장르 태그가 있음)을 사용할 수 있다고 생각합니다.

면책 조항 : 나는 변호사가 아닙니다. 본인의 책임하에 법률 자문을 받으십시오.

+0

MSD에 가사가 있다고 생각하지 않습니다. – pratnala

6

EDIT : Marsyas 페이지는 marsyasweb.appspot.com에서 호스팅되며 data sets 서브 페이지에서 GTZAN 데이터베이스에 대한 링크를 찾을 수 있습니다.

내 대학 프로젝트의 GTZAN 데이터 세트를 찾고 있었는데 http://marsyas.info이 다운 된 것을 알았 기 때문에 google web cache for marsyas.info/download/data_sets (자세한 정보 확인)을 사용했습니다. 다행히도 GTZAN 데이터 세트는 http://opihi.cs.uvic.ca에서 호스팅되며 download them 수 있습니다!

그러나 것은 데이터 세트를 사용하기 전에 라이센스 인식 (캐시 marsyas에서 정보를 다운로드 페이지) : G에 의해

이 데이터 세트는 장르 분류에 잘 알려진 논문에 사용 된

"오디오 신호의 음악 장르 분류를" Tzanetakis와 P.오디오 및 음성 처리에 관한 IEEE 거래의 요리사 2002.

불행히도 데이터베이스는 점차적으로 매우 연구 초기에 수집되었으므로 제목이 없습니다 (물론 저작권 허가 등이 없음). 이 파일은 다양한 녹음 조건을 나타 내기 위해 개인 CD, 라디오, 마이크 녹음 등 다양한 출처에서 2000-2001 년에 수집되었습니다. Nevetheless 나는이 데이터 세트를 사용하여 실험 결과를 게시하려는 경우 George Tzanetakis ([email protected])에게 연락하십시오.

데이터 세트는 30 초마다 1000 개의 오디오 트랙으로 구성됩니다. 여기에는 10 개의 장르가 있으며 각 장르는 100 개의 트랙으로 표시됩니다. 트랙은 .wav 형식의 모든 22050Hz 모노 16 비트 오디오 파일입니다.

아마도 Magnatagatune - http://tagatune.org/Magnatagatune.html과 같은 다른 데이터 세트에도 관심이있을 것입니다.