각 처리 된 관측치에 가장 가까운 값을 찾으려고합니다. (1.2M OBS에서 부분 데이터)는 다음과 같이 데이터를 보면 각 처리 관측 > dta
id treatment score
1: 5 0 0.02381024
2: 10 0 0.05428605
3: 22 0 0.02118124
4: 27 0 0.01495214
5: 45
data.table은 매우 유용하지만 다음과 같은 문제를 해결할 수있는 우아한 방법을 찾을 수 없습니다. 거기에 더 가까운 대답이 있지만, 아무도 내 문제를 해결하지 못했습니다. 아래와 같이 data.table 개체가 있고 유전자 쌍 (Gene1과 Gene2)을 기반으로 중복 행을 필터링하지만 두 방법으로 필터링하려고합니다. Gene1 및 Gene2에 대한
각 안에 각각 에 대해 SiteID의 최소값은 무엇입니까? 이 나는 시도했다 : ds_DT <- ds_fish[ , .SD[which.min(DSSite_Dis)], by = c("SiteID", "year")]
그러나 SiteID 및 year는 다른 길이 있습니다. year을 반복하여 SiteID 내에서 반복하여 내 머리를 감길 수 없습니다. wh
fread를 사용하여 데이터를 가져 오려고하지만 가져 오려는 데이터 세트가 zstd로 압축되었습니다. 가 나는 zstd 비슷한 일을 할 수 있나요 예를 들어 gzip으로 내가 ds <- fread('zcat file.csv.gz')
처럼 뭔가를 할 수 있다는 것을 알고? 감사합니다.
아래 결과를 얻는 더 좋은 방법이 있습니까? 내가 일반적으로 많은 열을 조작하기위한 접근 방법을 코딩 이런 종류의를 사용하고 있습니다 (v2 20 + 열을했다 상상, 그래서 새 열을 구축 할 수있는 동적 인 방법이 필요) 모든 set.seed(1)
dt <- data.table(m = 1:10, v1 = rnorm(10, 1), v2 = rnorm(10,
ID가 1,2 및 3이고 VALUE 열이 data.table이라고 가정합니다. 또한 통계를 계산하려는 하위 집합을 정의하는 ID의 순열 목록이 있습니다. 예 : library(data.table)
DT <- data.table(ID = c(1,1,2,2,3,3),VALUE = c(1,2,10,20,100,200))
permutations <- list(