1

저는 R이 매우 새롭고 다음을 수행 할 수있는 패키지에 대한 정보를 찾을 수 없습니다 : 데이터 세트 (예 : 다른 텍스트 문서)가 있다고 가정하면 여러 클래스를 가질 수 있습니다.R을 사용하는 계층 적 예측 R

예를 들어, 데이텀은 스포츠, 볼이있는 스포츠, 볼이없는 스포츠 및 자동차 일 수 있습니다. 데이터가 속한 스포츠라는 것을 고려하면 데이터가 속한 카테고리를 예측할 수 있기를 원합니다. 그러나 스포츠라고 정확하게 예측하면 기쁠 것입니다.

이런 종류의 물건을 제공 할 수있는 패키지는 무엇입니까? 가능한 경우 몇 가지 예가 유용 할 수 있습니다.

미리 감사

+0

설명을 더 명확하게 할 수 있습니까? 각 데이터가 동시에 여러 클래스에 속할 수 있도록 다중 레이블 분류자를 찾고 있습니까? 왜 그것을 계층 적이라고 부르는거야? –

+0

정확히 멀티 레이블이 아닙니다. 내가 recut/autos, rec/motorcycles, rec/sport/baseball, rec/sport/hockey, sci/crypt, sci/med와 같은 "leaves"클래스 내 데이터를 분류해야하기 때문에 계층 적이라고 불렀습니다. 일부 데이터는 예를 들어 적어도 rec 클래스에서 예측하고 rec 하위 클래스에서 더 나아갈 것을 예측할 수 있기를 바랍니다. 말이 돼? – gcolucci

+0

질문을 수정하여 어디에서 보여줄 수 있습니까? 그리고 아마도 R에 해당하지 않는 SVMstruct (http://www.cs.cornell.edu/people/tj/svm_light/svm_struct.html)에 관심이있을 것입니다. 그러나 R에 구조화 된 분류 도구에 대해 알지 못합니다. 아마도 다른 누군가 포인터가 있습니까? –

답변

0

에 내가 계층 적 분류를 할 수있는 R에서 특정 패키지를 인식하지입니다. 따라서 두 가지 옵션이 있습니다 :

  • C API SVMstruct http://www.cs.cornell.edu/people/tj/svm_light/svm_struct.html을 사용하십시오. 처음부터 R에서 이것을 프로그래밍하는 것은 꽤 효과적 일 것입니다.
  • 고유 한 계층 분류 시스템을 구축하십시오. 하향식의 경우 각 수준에 대해 다중 클래스 분류 기준을 적용합니다 (예 : rec vs sci 및 motorcycles vs sport 등등. 당신은 최고 분류자를 사용하고 예측을 사용하여 다음 분류자를 선택합니다. 분류 기준을 노드와 함께 훈련시키기 위해 입력하는 데이터는 해당 노드를 루트로하는 하위 트리의 모든 데이터를 합친 것입니다.

자세한 내용은 다음을 참조하십시오. http://jmlr.org/papers/v6/tsochantaridis05a.html

+0

도움을 주셔서 감사합니다. @kap. 두 번째 제안을 수행하려고합니다. 모든 것이 잘되기를 바랍니다. – gcolucci