나는 numpy를 매우 유용하다. 데이터 집합을 가져 와서 테스트 집합과 그 집합을 작성해야합니다. 데이터 세트가 150 행 4 열 (마지막 열이 레이블) 인 num30 배열 인 경우 데이터 세트가 다를 수 있으므로 올바른은 데이터 집합의 값으로 학습 및 테스트 배열을 채우는 방법은 무엇입니까? - 즉, 테스트 및 트레이닝 세트의 모양을 수동으로 쓰고 싶지는 않습니까?다른 배열의 값으로 2 개의 numpy 배열을 채우는 방법
내가 원하는 것은 분할 값이 제공되면 데이터 집합을 가져 와서 해당 값에 따라 분할 된 데이터 집합 행으로 테스트 및 교육 집합을 채울 것입니다.
는 그래서 같은 방법을 쓸 필요가 :
def split(dataset, value, training, test):
training = np.array #this is what I am confused about how to define
test = np.array
if random.random() < value:
#this is where I am confused about how to populate the arrays
append rows to training
else:
append rows to test
"분할 가치"란 무엇을 의미합니까? –