이미 몇 가지 예를 살펴 보았지만 필터링 된 사용 가능 값 &은 찾지 못했습니다. spread() ID를 기반으로하는 데이터 프레임 및 다른 열의 값
Date <-c('3/13/2017 6:21', '3/20/2017 6:28','3/13/2017 6:22','3/20/2017 6:28',' 3/13/2017 6:23','3/20/2017 6:28','3/13/2017 6:24',' 3/20/2017 6:28', ' 3/24/2017 6:28')
Enabled_value<-c(0,1,0,1,0,1,0,1,0)
Helper<-c('39RTU1','39RTU1','39RTU2','39RTU2','39RTU2','39RTU3','39RTU3','39RTU4','39RTU4', '39RTU4')
는 다음과 같다하기 : 당신이 볼 수 있듯이, 나는 각 관측을위한 타임 스탬프가
Helper Date(Enabled Value =0) Date (Enabled Value =1)
39RTU1 3/13/2017 6:20 3/20/2017 6:28
39RTU2 3/13/2017 6:21 3/20/2017 6:28
39RTU3 3/13/2017 6:22 3/20/2017 6:28
39RTU4 3/13/2017 6:24 3/20/2017 6:28
39RTU4 3/24/2017 6:28
- 각 행은 즉 0에서 1로 Enabled_value에서 이동 (인스턴스해야한다, 그리고 마지막 경우 (아래 39RTU4 참조) 단위 Enabled_value = 0, 새로운 라인이 있어야한다.
I가 이미 데이터 세트 (500K에서 행을 2000 ~ 3000) 환원 광범위한 연구를 수행 하였다.
tidyr
및 dplyr
을 사용하려고하는데 내 spread
은 오류를 계속 발생시킵니다.
> sorted_data1<-spread(sorted_data,Enabled_Value,Helper)
Error: Duplicate identifiers for rows (1340, 1342)
난 당신이'mutate_at (Enabled_value를 추가 할 경우이 질문으로, https://stackoverflow.com/questions/47043098/transpose-columns-group-by-time-and-customer-id – markdly