큰 데이터 세트가 있습니다. 나는 같은 크기 "s"로 각각 "n"개의 하위 데이터 세트로 나누고 싶다. 그러나 번호로 나눌 수없는 경우 마지막 데이터 세트는 다른 크기보다 작을 수 있습니다. csv 파일로 작업 디렉토리에 출력하십시오.임의의 열이 r 인 여러 데이터 세트로 분할 된 데이터 세트
는 다음과 같은 작은 예를 말할 수 있습니다 :
set.seed(1234)
mydf <- data.frame (matrix(sample(1:10, 130, replace = TRUE), ncol = 13))
mydf
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13
1 3 7 1 9 6 4 7 5 8 2 2 2 8
2 5 3 4 6 9 5 3 10 5 8 10 2 10
3 4 6 10 4 4 6 3 4 2 9 9 2 9
4 10 10 9 4 3 7 7 7 10 6 7 10 2
5 10 3 9 3 2 10 9 6 4 4 4 6 3
6 7 2 8 7 5 5 10 10 9 3 7 8 4
7 3 2 2 7 10 9 2 2 10 1 1 10 4
8 3 9 9 7 3 1 7 6 10 3 10 3 2
9 9 3 6 9 3 2 2 3 4 2 9 10 10
10 6 4 3 3 5 9 3 9 10 7 4 6 10
내가 무작위로 (13 열이 있기 때문에이 경우, 크기 3 말할 n 개의 부분 집합으로의 데이터 집합을 분할하는 함수를 만들려면을 - 마지막 데이터 세트에는 각각 1 개씩 나머지 열이 있습니다. 4) 각각 별도의 데이터 세트로 텍스트 파일로 출력됩니다. 나는 100 개 서브 데이터 셋을 생성하기 위해 가지고
set.seed(123)
reshuffled <- sample(1:length(mydf),length(mydf), replace = FALSE)
# just crazy manual divide
group1 <- reshuffled[1:3]; group2 <- reshuffled[4:6]; group3 <- reshuffled[7:9]
group4 <- reshuffled[10:12]; group5 <- reshuffled[13]
# just manual
data1 <- mydf[,group1]; data2 <- mydf[,group2]; ....so on;
# I want to write dimension of dataset at fist row of each dataset
cat (dim(data1))
write.csv(data1, "data1.csv"); write.csv(data2, "data2.csv"); .....so on
는 과정을 반복 할 수 있습니다 : 여기
내가 무슨 짓을?