data.table

4열

1답변

R에서 data.table을 사용하면 기준 필드가 정수일 때 하위 세트 또는 쿼리가 어떻게하나요?

나는 data.table 패키지를 사용하고 있습니다. 벡터 스캔보다 훨씬 빠른 바이너리 검색을 사용하여 하위 집합이나 쿼리 또는 검색 (또는 원하는대로 호출)에 대한 예제가 많이 있습니다. 다음은 도움말 파일의 발췌 부분입니다. DT["a"] # binary search (fast) DT[x=="a"] # vector scan (slow)

16열

1답변

외래 키의 SQL 조인을 R data.table 구문으로 변환

data.table 패키지는 SQL과 동일한 테이블 처리 메소드를 제공합니다. 테이블에 키가있는 경우 해당 키는 하나 이상의 열로 구성됩니다. 그러나 동시에 두 가지 방법으로 정렬 될 수 없으므로 테이블에는 둘 이상의 키가있을 수 없습니다. 이 예에서, X과 Y은 data.table s이고 단일 키 열 "id"; Y에는 키가 아닌 열 "x_id"도 있습니다

3열

1답변

reshape는 data.table에는 오류가 발생하지만 data.frame에는 오류가 발생합니다.

요약 통계의 데이터 프레임이 있습니다.이 데이터 프레임은 reshape를 사용하여 와이드로 변환됩니다. 이것은 잘 작동합니다. 그러나 테이블 사이에있는 data.table로 변환하면 (테스트 통계가있는 다른 열을 추가하기 위해) 데이터를 변경하지 않더라도 오류가 발생합니다. require(data.table) stats <- structure(list(

28열

2답변

data.table에 apply를 적용하려면 어떻게해야합니까?

2 ~ 20 열의 공백이있는 data.table이 있습니다 (예 : '종 이름'). 나는 "Species Name"이 "Species_Name"이되도록 모든 열에 동시에 str_replace()을 실행하고 싶습니다. data.table(apply(as.data.frame(dt[,2:dim(dt)[2], with=F]), 2, funct

1열

1답변

groupBy in data.table : 첫 번째 값 사용

실험 결과가 포함 된 R에 거대한 data.table이 있습니다. 각 결과에 대해 실행 ID와 구성 매개 변수는 두 개의 다른 행에 포함됩니다. conf 매개 변수는 모든 실행에 대해 일정합니다. > x=data.table(runId=rep(c(1,2,3,4,5,6),each=5),conf=rep(c(10,10,500,500,1000,1000), each=

5열

2답변

R의 data.table 패키지를 사용하여 키 값의 부정을 어떻게 서브 세트 할 수 있습니까?

R의 data.table 패키지는 키를 기반으로 한 빠른 하위 값 설정 기능을 제공합니다. 따라서, 예를 들어 : set.seed(1342) df1 <- data.table(group = gl(10, 10, labels = letters[1:10]), value = sample(1:100)) setkey(df1, group) df1

2열

2답변

data.frames를 병합하면 메모리 부족 오류가 발생합니다.

나는 4GB의 RAM을 가지고 있으며 오류 메시지 I 'm getting : Error: cannot allocate vector of size 147.6 Mb에 따라 Linux에서 R의 메모리로 147.6MB를 가져 오는 데 문제가 있습니다. 어떻게 진단 할 수 있습니까? IDs <- read.csv('Set1.csv') # 2 MB Set2 <- re

1열

2답변

두 데이터 프레임에서 점수 매트릭스 만들기

두 데이터 프레임 (foo, bar)에 저장된 변수 집합 (X)을 비교하려고합니다. 각 X은 최대 10 개의 값이 Y과 연결된 고유 한 독립 변수입니다. 나는 모든 bar.X에 모든 foo.X를 비교하고 그들이 공통으로 가지고있는 Y 값의 수를 비교함으로써 - 출력은 foo.x 축이 bar.x 길이 인 행렬이 될 수있다. foo는 바의 간단한 예는 2 ×

6열

1답변

ROW에서 행렬 행렬 연산

최근에 나는 data.table 패키지를 보았습니다. 행렬 방식의 행렬 연산을 수행하는 방법을 아직 잘 모르고 있습니다. 원래이 작업을 처리하려고 했습니까? 예를 들어, apply(M,1,fun)에 해당하는 data.table은 무엇입니까? fun은 벡터를 인수로 취해야합니다 (예 : mean, median 또는 mad).

4열

1답변

R에서 data.table을 사용하면 행을 제외하는 방법과 정수 열에 NA 값을 포함시키는 방법은 무엇입니까?

data.table을 상당히 사용하고 있습니다. 잘 작동하지만 바이너리 검색을 활용할 수 있도록 구문을 변환하는 데 오랜 시간이 걸린다는 것을 알고 있습니다. 유럽 고문 방지위원회는 값이 NA입니다 포함한 모든 행을 선택하지만, CPT 값이 23456 또는 10000 cpt <- c(23456,23456,10000,44555,44555,NA) desc