파일을 구문 분석하고 정보를 얻으려는 R 스크립트가 있지만 파일은 44GB입니다.R 스크립트를 perl로 만드시겠습니까?
파일을 더 빨리 읽는 프로그래밍 언어로이 글을 쓸 수있게 도와 줄 수 있습니까?
스크립트는 아주 간단합니다 :
ld <- read.table("plink-inter-chr---ld-window-r2-0.ld", header = T)
ldv1 <- do.call(rbind, strsplit(as.character(ld[,1]), "_"))
ldv4 <- do.call(rbind, strsplit(as.character(ld[,4]), "_"))
ld <- matrix(c(ldv1[,2], ldv4[,2], ld[,2], ld[,5], ld[,7]), ncol=5)
N <- 30
within <- numeric(N)
between <- numeric(N)
for(i in 1:N){
within[i] <- mean(as.numeric(ld[which(ld[,1] == i & ld[,2] == i),5]))
between[i] <- mean(as.numeric(ld[which(ld[,1] == i & ld[,2] != i),5]))
}
table <- matrix(c(within, between), ncol=2)
write.table(table, file = "within-between.tab", quote = FALSE, row.names = FALSE, col.names = FALSE)
그리고 파일과 같은 같습니다
CHR_A BP_A SNP_A CHR_B BP_B SNP_B R2 DP
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 2210 . 1 1
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 2419 . 1 1
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 2524 . 1 1
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 2587 . 1 1
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 2799 . 1 1
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 2947 . 1 1
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 3142 . 1 1
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 3178 . 1 1
NODE_1_length_193190_coverage_19.3759_GC_24.97 919 . NODE_1_length_193190_coverage_19.3759_GC_24.97 3261 . 1 1
는 R에 도움, 아드리안
R에 익숙하지 않은 사용자에게 출력 결과를 보여줄 수 있습니까? – mob
@AdrianP : 귀하의 * "누군가가 파일 읽기 속도가 빠른 프로그래밍 언어로 이것을 작성할 수 있습니까?"라는 의미입니까? 어떤 언어를 알고 있으며 어떤 도움이 필요합니까? 나는 이것이 귀하의 고용과 관련이 있다고 생각하며 다른 사람의 노력을 위해 사용하고 지불하는 것은 매우 잘못 될 것입니다. – Borodin
http://mysite.science.uottawa.ca/ncorradi/members.html 제 주인을하고 있습니다. 과학에서. 나는 나의 주인을 위해 부장을 얻지 만, 전통적인 의미에서 고용이 아니다. 나는 perl과 python을 약간 알고있다. –