5700 만 개의 행과 23 개의 열을 가진 데이터 세트가 있습니다. 서로 다른 종 (약 2000 개의 고유 한 이름)의 종명이있는 열이 있으며 각 고유 종의 이름에 대한 두 개의 데이터 열 (위도, 경도)을 꺼내고 각각에 대한 위도/경도 데이터를 작성합니다. 종, 파일 이름으로 종명. 이것은 내가 아는 유일한 언어 인 R에서 너무 오래 걸립니다. 이 작업에 적합한 코드는 무엇입니까? 제가 OSX에 터미널에 이런 종류의 작업을 수행 할 수 있습니다 상상SQL 루프를 읽고 파일에 데이터를 쓰십시오.
FOR i IN 1:unique(species_name)
SELECT latitude,longitude WHERE species_name=[i]
WRITE [some code that writes a text file with species name as the file name]
LOOP END;
을 :
이 나는 약, 코드처럼 보일 수 있습니다 추측하고 무엇을 보여주기 위해 여기에 몇 가지 의사 코드를 시도하고있다?
편집 20111211 : 다음은 R에서 내 흐름이다 : 당신이 할 수있는 최선의 일은에서 파일 이름과 쿼리를 스크립트 언어 (파이썬, 펄, PHP, 쉘)을 사용하여 생성입니다 이럴
require(RMySQL);
require(plyr)
drv <- dbDriver("MySQL")
con <- dbConnect(drv, user = "asdfaf", dbname = "test", host = "localhost")
splist <- read.csv("splist_use.csv")
sqlwrite <- function(spname) {
cat(spname) g1 <- dbGetQuery(con
, paste("SELECT col_16,col_18 FROM dat WHERE col_11='"
, spname, "'", sep="")
)
write.csv(g1, paste(spname, ".csv", sep=""))
rm("g1") }
l_ply(splist, sqlwrite, .progress="text")
어떤 SQL Server를 사용하고 있습니까? 대부분의 경우 사용자의 특정 상황에서 훨씬 더 빨라질 수있는 내보내기 기능을 제공합니다. – UnhandledExcepSean
MySQL. 내가 가진 유일한 GUI 인터페이스는 SequelPro입니다. – sckott
맞아요. 내보낼 수는 있었지만, 종을 걸러 내고 수출 한 다음 2000 시간을해야합니다. – sckott