data.table

1열

1답변

고유 한 값과 열 값을 기반으로 데이터 프레임의 행을 무작위로 그립니다.

많은 설명자 변수 (trt, individual, session)가있는 데이터 프레임이 있습니다. 가능한 trt x individual 조합의 일부를 무작위로 선택할 수 있지만 임의의 끌어 오기가 동일한 세션 번호를 갖지 않도록 세션 변수를 제어 할 수 있기를 원합니다. 나는 고유 한 세션 수와 각 trt x individual 조합의 2를 꺼내 어떻게 t

1열

1답변

각 구성 요소 (igraph)에 클러스터 ID를 추가하는 방법

데이터 집합의 두 열에 연결된 구성 요소를 얻기 위해 R에서 igraph 패키지를 사용하는 방법을 알고 있습니다. 데이터 library(data.table) df = fread( "rn A B 1: 11 6 2: 12 6 3: 11 7 4: 13 2 5: 12 7 6: 12 8 7: 17 2 8: 13 1")[, rn :=

2열

3답변

data.table을 사용하여 if-else 조건을 갖는 함수를 행별로 적용하는 방법은 무엇입니까?

아래 데이터 프레임에 함수를 적용해야합니다. '일'은 판매가입니다. 오프셋 값에 따라 매출을 오른쪽으로 이동해야합니다. 예를 들어 행 1의 오프셋이 1 인 경우, 0을 입력 한 후 1 일씩 판매를 변경해야합니다. id <- c('a', 'b', 'c', 'd', 'e', 'f') offset <- c(1,2,3,0,0,2) day1 <- c(1,2,3,

3열

1답변

하나의 data.table 호출에서 행을 부분 집합하고 정렬하는 방법은 무엇입니까?

나는 data.table을 배우고 있으며 평균을 계산하는 동안 그룹화 된 데이터의 부분 집합과 순서를 바꾸려 고하고 있는데, 모두 하나의 data.table 문으로 구성됩니다. 이 tutorial에이어서, here에서 항공편 데이터를 받았습니다. 튜토리얼에서 , 우리가 어떻게 캐리어 코드 "AA"에 대한 매월 평균 도착과 출발 지연 각 오리지널에 대한, 이

3열

2답변

그룹별로 레벨을 계산하십시오.

어떤 레벨이 가장 높은지 확인하는 질문이 있습니다. V1에서 Year Area V1 V2 V3 Count 2014 USA 200 50 50 5 2015 USA 300 75 80 5 2016 USA 500 125 60 2 2014 ASIA 100 25 60 5 2015 ASIA 400 100 80 3 2016 ASIA 100 25 50 1 ,

0열

1답변

불균형 패널 데이터 : 첫 번째 관찰 연도를 기준으로 한 인덱스 계산

대용량 데이터베이스를 사용한 작업 이후 루프가없는 일부 계산을 효율적으로 수행하는 것과 관련하여 다시 한 번 질문합니다. 기본 불균형 패널 데이터 세트는 아래의 df1 형식을 취합니다. 보시다시피, 서로 다른 해에 관찰 된 개인 (ID)이 있습니다. 때때로 또한 놀았 년 (ID 4 참조) library(data.table) df1 = data.table(

1열

1답변

매일 데이터를 주간 데이터로 변환하고 휴일을 처리하십시오.

일일 데이터가 포함 된 데이터 테이블이 있습니다. 이 데이터 표에서 매주 수요일에 얻은 주별 데이터 포인트를 추출하려고합니다. 수요일이 공휴일 인 경우, 즉 데이터 표에서 사용할 수없는 경우 다음 사용 가능한 데이터 포인트를 사용해야합니다. 여기 MWE : 출력 library(data.table) df <- data.table(date=as.Date(c(

0열

1답변

데이터의 마지막 열을 가져 오지 못합니다.

저는 멍청 해요. 그래서 나는 a이라는 변수에 data.table을 가지고있다. 나는 마지막 열을 일반적으로 얻으려고 노력하고있다. 열 6을 지정할 때 작동하지만 ncol(a)과 작동하지 않습니다. 왜 그런가요? (https://cran.r-project.org/web/packages/data.table/ - class(a) [1] "data.table"

3열

1답변

모든 부분 집합이 나는 경우

을 행하기보다는 데이터의 선택된 블록 당이되도록 data.table 필터링 다음 data.table matchID characterID info 1111 4 abc 1111 12 def 1111 1 ghi 2222 8 jkl 2222 7 mno 2222 3 pwr 3333 9 abc 3333 2 ghi 333

0열

1답변

다른 유형의 동일한 범주 형 변수에 대해 다른 p 값을 생성하는 glm

glm을 사용하여 모델 적합성을 생성 중입니다. 내 데이터에는 정수 변수와 범주 형 변수가 혼합되어 있습니다. 범주 형 변수는 코드 형식이므로 데이터의 정수 유형입니다. 처음에 모델을 만들려고 할 때 정수형 형식의 범주 형 변수를 그대로 전달하고 모델을 얻었습니다. 나는 p 값을 한번 확인해 보았습니다. 그 값은 중요합니다. 그리고 주목할만한 변수가 거의