data.table의 키를 생성 한 후 "그룹 카운터는"data.table "키 인덱스"또는
set.seed(12345)
DT <- data.table(x = sample(LETTERS[1:3], 10, replace = TRUE),
y = sample(LETTERS[1:3], 10, replace = TRUE))
setkey(DT, x, y)
DT
# x y
# [1,] A B
# [2,] A B
# [3,] B B
# [4,] B B
# [5,] C A
# [6,] C A
# [7,] C A
# [8,] C A
# [9,] C C
# [10,] C C
나는 정수 벡터는 각 행에 대응하는 "키 인덱스"를주고 좀하고 싶습니다 .
# x y i
# [1,] A B 1
# [2,] A B 1
# [3,] B B 2
# [4,] B B 2
# [5,] C A 3
# [6,] C A 3
# [7,] C A 3
# [8,] C A 3
# [9,] C C 4
# [10,] C C 4
내가 cumsum(!duplicated(DT[, key(DT), with = FALSE]))
같은 것을 사용에 대한 생각하지만, 더 나은 솔루션이 바라고 : 나는 예상되는 출력 (열 i
가) 아래 무슨 뜻인지 명확히 도움이되기를 바랍니다. 이 벡터가 테이블의 내부 표현의 일부가 될 수 있다고 생각합니다. 아마도이 벡터에 액세스 할 수있는 방법이 있을까요? 그것이 사실이 아니더라도, 당신은 무엇을 건의 할 것입니까?
나는 .GRP가 아주 좋은 생각이고, 과거에는 그것을 바랬다 고 생각한다. 멋지고 겉으로보기에는 최적의 해결책입니다. –
@ JoshO'Brien Ok, .GRP가 1.8.3에 추가되었습니다. –
'.SDcols'와 같은 다른 변수에 대한 문서는 어떻게 찾을 수 있습니까? ?? .GRP' 등 –