data.table

    1

    1답변

    많은 설명자 변수 (trt, individual, session)가있는 데이터 프레임이 있습니다. 가능한 trt x individual 조합의 일부를 무작위로 선택할 수 있지만 임의의 끌어 오기가 동일한 세션 번호를 갖지 않도록 세션 변수를 제어 할 수 있기를 원합니다. 나는 고유 한 세션 수와 각 trt x individual 조합의 2를 꺼내 어떻게 t

    1

    1답변

    데이터 집합의 두 열에 연결된 구성 요소를 얻기 위해 R에서 igraph 패키지를 사용하는 방법을 알고 있습니다. 데이터 library(data.table) df = fread( "rn A B 1: 11 6 2: 12 6 3: 11 7 4: 13 2 5: 12 7 6: 12 8 7: 17 2 8: 13 1")[, rn :=

    2

    3답변

    아래 데이터 프레임에 함수를 적용해야합니다. '일'은 판매가입니다. 오프셋 값에 따라 매출을 오른쪽으로 이동해야합니다. 예를 들어 행 1의 오프셋이 1 인 경우, 0을 입력 한 후 1 일씩 판매를 변경해야합니다. id <- c('a', 'b', 'c', 'd', 'e', 'f') offset <- c(1,2,3,0,0,2) day1 <- c(1,2,3,

    3

    1답변

    나는 data.table을 배우고 있으며 평균을 계산하는 동안 그룹화 된 데이터의 부분 집합과 순서를 바꾸려 고하고 있는데, 모두 하나의 data.table 문으로 구성됩니다. 이 tutorial에이어서, here에서 항공편 데이터를 받았습니다. 튜토리얼에서 , 우리가 어떻게 캐리어 코드 "AA"에 대한 매월 평균 도착과 출발 지연 각 오리지널에 대한, 이

    3

    2답변

    어떤 레벨이 가장 높은지 확인하는 질문이 있습니다. V1에서 Year Area V1 V2 V3 Count 2014 USA 200 50 50 5 2015 USA 300 75 80 5 2016 USA 500 125 60 2 2014 ASIA 100 25 60 5 2015 ASIA 400 100 80 3 2016 ASIA 100 25 50 1 ,

    0

    1답변

    대용량 데이터베이스를 사용한 작업 이후 루프가없는 일부 계산을 효율적으로 수행하는 것과 관련하여 다시 한 번 질문합니다. 기본 불균형 패널 데이터 세트는 아래의 df1 형식을 취합니다. 보시다시피, 서로 다른 해에 관찰 된 개인 (ID)이 있습니다. 때때로 또한 놀았 년 (ID 4 참조) library(data.table) df1 = data.table(

    1

    1답변

    일일 데이터가 포함 된 데이터 테이블이 있습니다. 이 데이터 표에서 매주 수요일에 얻은 주별 데이터 포인트를 추출하려고합니다. 수요일이 공휴일 인 경우, 즉 데이터 표에서 사용할 수없는 경우 다음 사용 가능한 데이터 포인트를 사용해야합니다. 여기 MWE : 출력 library(data.table) df <- data.table(date=as.Date(c(

    0

    1답변

    저는 멍청 해요. 그래서 나는 a이라는 변수에 data.table을 가지고있다. 나는 마지막 열을 일반적으로 얻으려고 노력하고있다. 열 6을 지정할 때 작동하지만 ncol(a)과 작동하지 않습니다. 왜 그런가요? (https://cran.r-project.org/web/packages/data.table/ - class(a) [1] "data.table"

    3

    1답변

    을 행하기보다는 데이터의 선택된 블록 당이되도록 data.table 필터링 다음 data.table matchID characterID info 1111 4 abc 1111 12 def 1111 1 ghi 2222 8 jkl 2222 7 mno 2222 3 pwr 3333 9 abc 3333 2 ghi 333

    0

    1답변

    glm을 사용하여 모델 적합성을 생성 중입니다. 내 데이터에는 정수 변수와 범주 형 변수가 혼합되어 있습니다. 범주 형 변수는 코드 형식이므로 데이터의 정수 유형입니다. 처음에 모델을 만들려고 할 때 정수형 형식의 범주 형 변수를 그대로 전달하고 모델을 얻었습니다. 나는 p 값을 한번 확인해 보았습니다. 그 값은 중요합니다. 그리고 주목할만한 변수가 거의