1
데이터 마이닝에 대한 질문이 있습니다. 4 개의 클래스에 속하는 74 개의 인스턴스로 구성된 데이터 세트가 있습니다. 각 클래스의 수는 일부 분류 자 (svm, rna, knn)를 사용하여 좋은 정확도를 얻는 데 충분하지 않으므로 각 클래스의 인스턴스 수를 "오버 샘플링"해야합니다.엡실론 오버 샘플링
나는 이것을 할 방법이 있다고 들었습니다. 다음과 같이 이러한 새 인스턴스를 생성합니다.
new_instance <---- original_instance + u(epsilon)
그러나 나는 그것에 대해 더 많은 지식을 가지고 있지 않습니다.
누구든지이 방법을 사용하여 데이터를 "오버 샘플링"했습니까?