2017-03-07 1 views
1

인터넷을 통해 전 감독 및 감독되지 않은 기계 학습 알고리즘의 응용 프로그램을 볼 수 있지만 컴퓨터 학습 응용 프로그램의 품질을 유지하는 것에 대해서는 아무도 이야기하지 않습니다. 이러한 점을 제기 자율 기계 학습 알고리즘을 테스트하는 방법에 대한 최근 분석 :

감독되지 않은 컴퓨터 학습 알고리즘 테스트

1) 교차 검증 테스트 : 데이터 집합은 동일 주름 (부품) 및 제외한 모든 주름으로 나누어 져 훈련 데이터 세트로 사용된다 나중에 테스트 데이터 세트로 사용됩니다.

테스트 및 학습 데이터 세트 사용과 관련하여 몇 가지 옵션이 있습니다.
출력이 불확실한 곳에서 감독되지 않은 ML 알고리즘을보다 효과적으로 테스트 할 수 있습니까?

+0

외부 기준 (= 감독되지 않음)이 없기 때문에 감독되지 않은 기계 학습 알고리즘의 품질을 평가하는 것은 문제가 있습니다. 특정 응용 프로그램 (클러스터링, 차원 감소, ...)을 대상으로하지 않는 경우이 질문에 답변하기에는 너무 광범위합니다. 또한 교차 확인은 감독 된 기계 학습 알고리즘의 평가에 가장 많이 사용됩니다. –

+0

https://stats.stackexchange.com/에서이 질문을하는 것이 좋습니다. –

답변

0

사용한 알고리즘 (및 선택한 거리)의 유형에 따라 그룹 내 분산과 그룹 내 분산이 많이 바뀌는 지 계속 확인할 수 있습니다.

알고리즘을 구축했을 때와 같은 수준의 알고리즘을 사용하면 분산과 분산이 그다지 변하지 않습니다. 축소 (또는 역) 사이의 차이라면 그룹이 알고리즘에 의해 이전처럼 분리되지 않았다는 것을 의미합니다.

두 번째 시도는 알고리즘을 재교육 한 후에도 동일한 그룹에 속해 있는지 관찰 할 수있는 관찰 결과를 유지하는 것입니다. 그렇지 않은 경우 알고리즘이 잘못되었음을 의미하는 것은 아니지만이 경우 더 자세히 보도록 경고를 보낼 수 있습니다.

관련 문제