그래서 큰 데이터 집합 (내 이전 질문을 참조하십시오) 내가 다른 테이블에 가지고있는 ID를 기반으로 부분 집합을해야합니다.큰 테이블의 RSQLite Fat Subsetting?
다음과 같은 문을 사용합니다.
vars <- dbListFields(db, "UNIVERSE")
ids <- dbGetQuery(db, "SELECT ID FROM LIST1"
dbGetQuery(db,
paste("CREATE TABLE SUB1 (",
paste(vars,collapse=" int,"),
")"
) )
dbGetQuery(db,
paste("INSERT INTO SUB1 (",
paste(vars,collapse=","),
") SELECT * FROM UNIVERSE WHERE
UNIVERSE.ID IN (",
paste(t(ids),collapse=","),
")"
) )
코드가 실행됩니다. 나는 위의 괄호를 놓쳤을지도 모른다). 그러나 나의 테이블 UNIVERSE가 크기로 약 10 기가이기 때문에 그것은 시간이 오래 걸린다. 주요한 문제는 "SUB #"을 만들기 위해 많은 다른 테이블 "LIST #"에 대해 이것을 실행해야 할 것이므로 서브 세트가 분리되지 않도록 UNIVERSE에서 레코드를 삭제할 수 없습니다. 그것.
잘못 설정된 부분 집합에 대해 생각해 보았나요 아니면 다른 방법으로 속도를 높일 수 있는지 궁금합니다.
도움을 주셔서 감사합니다.
문제에 대한 답변을 찾았습니까? 이것을 처리하는 몇 가지 다른 방법이 있습니다. – Jay
각 #에 대해 phsycially 다른 테이블로 끝나기를 원하십니까/필요합니까? – Jay