분류 중에 훈련 데이터를 n 번 복사하는 방법은 무엇입니까?

필자는 200 점과 50 점으로 된 두 가지 데이터 집합으로 분류 문제가 있습니다. 이 40 개의 데이터 포인트 중 테스트 세트로 사용됩니다. 나는 5 명의 가장 가까운 이웃을 고려한 분류 자로서 kNN을 선택했다.분류 중에 훈련 데이터를 n 번 복사하는 방법은 무엇입니까?

n_neighbors = 5 
std = 5 

# generate data 

X0, y0 = make_blobs(n_samples=200, centers=2, n_features=2, cluster_std = std, random_state=42) 
h = .1 # step size in the mesh 

X1, y1 = make_blobs(n_samples=50, centers=2, n_features=2, cluster_std = std, random_state=42) 

# split into training and test set 
X0_train, X0_test, y0_train, y0_test = train_test_split(X0, y0, test_size=0.2, random_state=42) 

X1_train, X1_test, y1_train, y1_test = train_test_split(X1, y1, test_size=0.2, random_state=42)

I 클래스 1을위한 훈련 데이터가 16 배, 같은 클래스 1은 0

가 어떻게이 복사 할 수 있습니다 클래스와 같은 교육 크기가 복사되는 방식으로 데이터를 풍부하게해야 훈련 데이터 16 번? 나는 단서를 가지고 있지 않다. 정확하게 여기에서 복사가 의미하는 바가있다.

누구나 같은 줄을 설명 할 수 있습니까?

출처

2016-12-15 Rishik Mani

나는이 문제로부터 극복하는 inorder를, 클래스 불균형 문제에 대해 이야기하고 있다는 생각, 당신은

) 다음과 같은 기술 :( https://www.cs.cmu.edu/afs/cs/project/jair/pub/volume16/chawla02a-html/chawla2002.html을 도울 수 있는지, (위 또는 샘플링 아래 중 하나) 을 샘플링 할 필요가

출처

2016-12-16 05:01:14 MargS

분류 중에 훈련 데이터를 n 번 복사하는 방법은 무엇입니까?

답변

관련 문제