data.table

    4

    1답변

    나는 data.table 패키지를 사용하고 있습니다. 벡터 스캔보다 훨씬 빠른 바이너리 검색을 사용하여 하위 집합이나 쿼리 또는 검색 (또는 원하는대로 호출)에 대한 예제가 많이 있습니다. 다음은 도움말 파일의 발췌 부분입니다. DT["a"] # binary search (fast) DT[x=="a"] # vector scan (slow)

    16

    1답변

    data.table 패키지는 SQL과 동일한 테이블 처리 메소드를 제공합니다. 테이블에 키가있는 경우 해당 키는 하나 이상의 열로 구성됩니다. 그러나 동시에 두 가지 방법으로 정렬 될 수 없으므로 테이블에는 둘 이상의 키가있을 수 없습니다. 이 예에서, X과 Y은 data.table s이고 단일 키 열 "id"; Y에는 키가 아닌 열 "x_id"도 있습니다

    3

    1답변

    요약 통계의 데이터 프레임이 있습니다.이 데이터 프레임은 reshape를 사용하여 와이드로 변환됩니다. 이것은 잘 작동합니다. 그러나 테이블 사이에있는 data.table로 변환하면 (테스트 통계가있는 다른 열을 추가하기 위해) 데이터를 변경하지 않더라도 오류가 발생합니다. require(data.table) stats <- structure(list(

    28

    2답변

    2 ~ 20 열의 공백이있는 data.table이 있습니다 (예 : '종 이름'). 나는 "Species Name"이 "Species_Name"이되도록 모든 열에 동시에 str_replace()을 실행하고 싶습니다. data.table(apply(as.data.frame(dt[,2:dim(dt)[2], with=F]), 2, funct

    1

    1답변

    실험 결과가 포함 된 R에 거대한 data.table이 있습니다. 각 결과에 대해 실행 ID와 구성 매개 변수는 두 개의 다른 행에 포함됩니다. conf 매개 변수는 모든 실행에 대해 일정합니다. > x=data.table(runId=rep(c(1,2,3,4,5,6),each=5),conf=rep(c(10,10,500,500,1000,1000), each=

    5

    2답변

    R의 data.table 패키지는 키를 기반으로 한 빠른 하위 값 설정 기능을 제공합니다. 따라서, 예를 들어 : set.seed(1342) df1 <- data.table(group = gl(10, 10, labels = letters[1:10]), value = sample(1:100)) setkey(df1, group) df1

    2

    2답변

    나는 4GB의 RAM을 가지고 있으며 오류 메시지 I 'm getting : Error: cannot allocate vector of size 147.6 Mb에 따라 Linux에서 R의 메모리로 147.6MB를 가져 오는 데 문제가 있습니다. 어떻게 진단 할 수 있습니까? IDs <- read.csv('Set1.csv') # 2 MB Set2 <- re

    1

    2답변

    두 데이터 프레임 (foo, bar)에 저장된 변수 집합 (X)을 비교하려고합니다. 각 X은 최대 10 개의 값이 Y과 연결된 고유 한 독립 변수입니다. 나는 모든 bar.X에 모든 foo.X를 비교하고 그들이 공통으로 가지고있는 Y 값의 수를 비교함으로써 - 출력은 foo.x 축이 bar.x 길이 인 행렬이 될 수있다. foo는 바의 간단한 예는 2 ×

    6

    1답변

    최근에 나는 data.table 패키지를 보았습니다. 행렬 방식의 행렬 연산을 수행하는 방법을 아직 잘 모르고 있습니다. 원래이 작업을 처리하려고 했습니까? 예를 들어, apply(M,1,fun)에 해당하는 data.table은 무엇입니까? fun은 벡터를 인수로 취해야합니다 (예 : mean, median 또는 mad).

    4

    1답변

    data.table을 상당히 사용하고 있습니다. 잘 작동하지만 바이너리 검색을 활용할 수 있도록 구문을 변환하는 데 오랜 시간이 걸린다는 것을 알고 있습니다. 유럽 ​​고문 방지위원회는 값이 NA입니다 포함한 모든 행을 선택하지만, CPT 값이 23456 또는 10000 cpt <- c(23456,23456,10000,44555,44555,NA) desc