data.table

5열

2답변

각 처리 된 관측치에 가장 가까운 값을 찾으려고합니다. (1.2M OBS에서 부분 데이터)는 다음과 같이 데이터를 보면 각 처리 관측 > dta id treatment score 1: 5 0 0.02381024 2: 10 0 0.05428605 3: 22 0 0.02118124 4: 27 0 0.01495214 5: 45

3열

2답변

큰 데이터 세트의 빠른 하위 집합/조회/필터

요인 및 숫자 열이있는 큰 (많은 GB) 테이블에서 "가장 가까운"행을 반복적으로 조회해야합니다. 여기 df <- data.frame(factorA = rep(letters[1:3], 100000), factorB = sample(rep(letters[1:3], 100000), 3*100000, replace = FALSE

0열

1답변

R data.table 한 쌍의 열로 된 중복 행

data.table은 매우 유용하지만 다음과 같은 문제를 해결할 수있는 우아한 방법을 찾을 수 없습니다. 거기에 더 가까운 대답이 있지만, 아무도 내 문제를 해결하지 못했습니다. 아래와 같이 data.table 개체가 있고 유전자 쌍 (Gene1과 Gene2)을 기반으로 중복 행을 필터링하지만 두 방법으로 필터링하려고합니다. Gene1 및 Gene2에 대한

0열

1답변

내 최초의 객체의 클래스를 수정

제목이 말하듯, 대신 foo <-x을 할당 # install.packages(c("dplyr"), dependencies = TRUE) library(dplyr) tbl <- tibble(id = rep(0:1, c(7, 10)), grp = rep(c(0,1,0,1,2), c(3,4,2,5,3)), LET = rep(c('A'

0열

2답변

R 최소 x를 2 개 그룹으로 찾으십시오.

각 안에 각각 에 대해 SiteID의 최소값은 무엇입니까? 이 나는 시도했다 : ds_DT <- ds_fish[ , .SD[which.min(DSSite_Dis)], by = c("SiteID", "year")] 그러나 SiteID 및 year는 다른 길이 있습니다. year을 반복하여 SiteID 내에서 반복하여 내 머리를 감길 수 없습니다. wh

0열

1답변

spread()를 사용하면 data.table이 복사됩니까?

다음은 샘플 data.table입니다. set.seed(123) mydt <- data.table(id = 1:100, x = sample(LETTERS[1:6], size = 100, replace = TRUE), group = paste0("group", sample(1:3, size = 100, replace = TRUE)), prob = runif

1열

1답변

.zstd로 압축 된 데이터 파일 가져 오기

fread를 사용하여 데이터를 가져 오려고하지만 가져 오려는 데이터 세트가 zstd로 압축되었습니다. 가 나는 zstd 비슷한 일을 할 수 있나요 예를 들어 gzip으로 내가 ds <- fread('zcat file.csv.gz') 처럼 뭔가를 할 수 있다는 것을 알고? 감사합니다.

0열

1답변

재정렬 행은

내가 가지고 data.table이 같은 ds <- data.table(ID = c(1,1,1,1,1,2,2,2,2,2), Month = c("Jan", "Feb", "Mar", "Apr", "May", "Jan", "Feb", "Mar", "Apr", "May"), val = c(1,2,3,4,5,6,7,8,9,10)) ds

1열

1답변

이전 열의 함수 인 열을 동적으로 추가하는 우아한 방법

아래 결과를 얻는 더 좋은 방법이 있습니까? 내가 일반적으로 많은 열을 조작하기위한 접근 방법을 코딩 이런 종류의를 사용하고 있습니다 (v2 20 + 열을했다 상상, 그래서 새 열을 구축 할 수있는 동적 인 방법이 필요) 모든 set.seed(1) dt <- data.table(m = 1:10, v1 = rnorm(10, 1), v2 = rnorm(10,

1열

2답변

그룹화 변수의 목록에 대한 열의 집합

ID가 1,2 및 3이고 VALUE 열이 data.table이라고 가정합니다. 또한 통계를 계산하려는 하위 집합을 정의하는 ID의 순열 목록이 있습니다. 예 : library(data.table) DT <- data.table(ID = c(1,1,2,2,3,3),VALUE = c(1,2,10,20,100,200)) permutations <- list(