2012-01-13 3 views
1

버섯 종류가 많은 레코드를 제공했습니다. 이들은 식용과 유독로 분류해야합니다. 분류는 k-nearest-neighbors (1) 및 J48에서 수행해야합니다.J48 및 IBk (KNN) 알고리즘으로 분류

두 알고리즘 모두 99.88 %의 정밀도를 나타냅니다. 나를 위해 관련성이 거짓 긍정적 인 속도입니다. J48의 비율은 0.3 %이며 KNN은 0 %입니다. 그래서 나는 KNN이 선택된 문제에 더 잘 적응할 수 있다고 말할 것입니다.

그러나 나는 왜 대답을 알지 못합니다. JN48보다 KNN이 더 나은 이유에 대한 일반적인 대답이 있습니까?

둘째, 10 배 교차 유효성 검사를 사용해야합니다. 그게 뭐라 구요? 사전에

감사

답변

1

는 KNN은 J48보다는 일부 레코드에 대한 bether입니다 왜 일반 정보 응답 있는가?

아니요 두 알고리즘의 설정과 평가 수행 방식에 따라 다릅니다 (별도의 교육 및 테스트 세트를 사용 했습니까?).

교차 유효성 검사가 의미 10 배 : 당신이 그 주름의 각각에 대하여 다음, 10 똑같이 크기의 데이터 집합을 분할 "주름"내가

  • 평가 다른 모든 구 주름에

    • 기차 접을 수 있음 i

    평균 정확도를 취하십시오. Wikipedia 또는 기계 학습에 관한 책을 참조하십시오.

  • +0

    아니요, 특성 및 클래스가있는 하나의 데이터 세트 (* .arff-File) 만 사용했습니다. – user1147739

    +0

    @ user1147739 : 결과가 완전히 유효하지 않습니다. 평가를 위해 항상 별도의 교육 및 테스트 세트를 사용하거나 교차 검증을 사용해야합니다. 다시 한 번, 기계 학습에 관한 책을보십시오. –

    +0

    하지만 내가 말했듯이, 나는 10 배 교차 검증을 사용했다. 그럼 내 결과는 ivalid하지 않니? 예, 읽습니다 ... ;-) – user1147739