1

데이터 마이닝에 대한 질문이 있습니다. 4 개의 클래스에 속하는 74 개의 인스턴스로 구성된 데이터 세트가 있습니다. 각 클래스의 수는 일부 분류 자 ​​(svm, rna, knn)를 사용하여 좋은 정확도를 얻는 데 충분하지 않으므로 각 클래스의 인스턴스 수를 "오버 샘플링"해야합니다.엡실론 오버 샘플링

나는 이것을 할 방법이 있다고 들었습니다. 다음과 같이 이러한 새 인스턴스를 생성합니다.

new_instance <---- original_instance + u(epsilon) 

그러나 나는 그것에 대해 더 많은 지식을 가지고 있지 않습니다.

누구든지이 방법을 사용하여 데이터를 "오버 샘플링"했습니까?

답변

0

나는이 오버 샘플링 방법을 사용한 적이 없지만 유용한 포인터를 찾을 수있을 것이라고 생각합니다. in this paper.

몇 가지 오버 샘플링 및 언더 샘플링이 설명됩니다. 그것은 당신이 당신의 경우에 더 적합한 방법을 찾는 데 도움이 될 것입니다.