KNN을 사용하여 자필 자릿수를 분류하고 있습니다. 나는 또한 차원을 줄이기 위해 PCA를 구현했다. 256에서 나는 200으로 갔다. 그러나 나는 단지 ~ 0.10 %의 정보 손실을 느낀다. 나는 56 차원을 삭제했다. 손실이 더 커야하지 않습니까? 5 차원으로 떨어질 때만 ~ 20 %의 손실이 발생합니다. 이게 정상인가?PCA 및 KNN 알고리즘
답변
56 개의 치수를 제거한 후에 정보가 거의 손실되지 않았다는 말입니까? 물론, 그것이 바로 PCA의 요지입니다! Principal Component Analysis은 이름이 명시된대로 정보를 전달하는 크기를 결정하는 데 도움이됩니다. 나머지 부분은 제거 할 수 있으며 나머지 부분은 제거 할 수 있습니다.
나는 유전자 분석에서 치수가 PCA로 40'000에서 100으로 감소 된 논문을 읽은 다음 마술 같은 것들을하고 19 가지 차원의 우수한 분류자를 가지고 있습니다. 이것은 암시 적으로 39'900 차원을 제거 할 때 사실상 정보가 손실되었음을 알려줍니다!
감사합니다. 나는 기계 학습에 다소 익숙하다. –
정상입니다. 그렇습니다 (그리고 Fezvez는 당신이 한 일의 요점을 말해줍니다.) 귀하의 사례는 실제로 그것이 가능한 방법을 볼 수있는 좋은 예입니다.
귀하의 데이터를보십시오 (기계 학습에서 항상 중요합니다, 은 데이터를 알고 있습니다). 만약 당신이 하얀색의 검정색 손으로 쓴 숫자의 이미지를 가지고 있다면, 어떤 모서리의 픽셀이 모든 샘플에 대해 흰색 일 가능성이 높습니다. (나는 손으로 쓰여진 숫자로 기계를 학습했을 때 그것을 한 모서리에 가지고있었습니다.) 따라서 픽셀에는 실제로 아무 정보도 없습니다. KNN이나 ANN 등의 입력 내용을 삭제하면 동일한 결과가 나타납니다.
- 1. 데이터베이스를 검색하기위한 KNN 알고리즘
- 2. 이웃의 수 KNN 알고리즘
- 3. PCA 분석 및 파이썬
- 4. J48 및 IBk (KNN) 알고리즘으로 분류
- 5. j48 알고리즘 내부에 IBk (knn) 주입하는 방법? (weka, java)
- 6. OpenCv에서 PCA 프로젝트 및 backproject
- 7. OpenCV 2.2 PCA 및 EigenFaces
- 8. MATLAB의 KNN 분류 - 혼동 행렬 및 ROC?
- 9. ggplot의 KNN 모델 윤곽?
- 10. PCA FactoMineR 플롯 데이터
- 11. OpenCV 2.3의 PCA 프로젝트 및 Backproject
- 12. OpenCV의 PCA 및 데이터 준비 방법
- 13. PCA 인식 OpenCV 2.3
- 14. Java에서의 PCA 구현
- 15. OpenCV PCA Python에서 계산
- 16. OpenCV PCA 질문
- 17. opencv에서 pca 객체 저장
- 18. OpenCV의 KNN 알 수없는 분류
- 19. PCA 얼굴 인식, 구현 기법
- 20. WEKA kNN 및 동적 시간 왜곡 값 줄이기
- 21. PCA 계산의 복잡한 고유 값
- 22. 최적의 분류 알고리즘
- 23. 범주 형 데이터를 사용한 KNN 분류
- 24. 높은 디밍 공간에 동적 삽입이있는 kNN
- 25. 검색 로직 및 알고리즘
- 26. Prim 및 Kruskal 알고리즘
- 27. STL 알고리즘 및 const_iterators
- 28. 알고리즘 및 스크립트 정의
- 29. 그룹화 및 알고리즘 도움
- 30. ListAdapters 및 WrapperListAdapter 알고리즘
그런 종류의 일은 많은 유형의 애플리케이션에서 일반적입니다. 그것은 수익 감소의 포인트라고합니다. –