2012-05-08 2 views
0

두 개의 종속적 인 연속 변수가 있고 세 번째 이진 변수의 값을 예측하기 위해 결합 된 값을 사용하고 싶습니다. 값을 이산화/범주화하는 방법은 무엇입니까? 나는 클러스터링 알고리즘을 찾고 있지 않다, 나는 베이시스 분류 자에서 연속적으로 사용할 수있는 '의미있는'이산 카테고리를 얻는데 특히 관심이있다. 논문, 서적, 온라인 과정에 대한 참고 자료, 모두 매우 감사합니다!연속 데이터를 분류하는 방법은 무엇입니까?

답변

0

그것은 기계 학습의 본질이며 가장 많이 연구 된 문제 중 하나입니다.

최소 이진 회귀, 로지스틱 회귀, SVM, 임의의 포리 스트가이 유형의 문제에 널리 사용되며이를 이진 분류라고합니다.

귀하의 목표가 실제적으로 데이터를 분류하는 것이라면, Scikits-learn in python과 weka in java와 같은 여러 라이브러리를 사용할 수 있습니다. 그들은 훌륭한 문서를 가지고있다.

하지만 기계 학습의 고유 기능을 이해하려면 기계 학습 리소스를 검색 (여기 또는 Google)하십시오.

+0

나는 일반적으로 분류에 관한 것이 아닌 분류에 관한보다 명확한 질문을 편집했다. – Ivana

0

실제 괴상한 사람이되고 싶다면 다른 가능한 이산화의 모음을 생성 한 다음 분류기를 훈련시킨 다음 그 특징을 기준으로 이산화를 특성화 한 다음 분류기를 실행하여 어떤 이산화 가는지 확인하십시오 베스트!?

일반적으로 이산화 요소는 더 많은 예술이며 입력 변수 범위의 의미를 잘 이해하고 있습니다.

관련 문제