큰 데이터 세트로 작업하고 있습니다. 아래에 그 예가 나와 있습니다. 개별 파일의 대다수에는 하루 이상의 가치가있는 데이터를 처리해야합니다.대부분의 일별 레코드로 하위 데이터 프레임
Date <- c("05/12/2012 05:00:00", "05/12/2012 06:00:00", "05/12/2012 07:00:00",
"05/12/2012 08:00:00", "06/12/2012 07:00:00", "06/12/2012 08:00:00",
"07/12/2012 05:00:00", "07/12/2012 06:00:00", "07/12/2012 07:00:00",
"07/12/2012 08:00:00")
Date <- strptime(Date, "%d/%m/%Y %H:%M")
c <- c("0","1","5","4","6","8","0","3","10","6")
c <- as.numeric(c)
df1 <- data.frame(Date,c,stringsAsFactors = FALSE)
하루 동안 만 데이터를 남기고 싶습니다. 이 날은 해당 날짜에 가장 많은 수의 데이터 요소를 가짐으로써 선택됩니다. 어떤 이유로 든 최대 2 일간의 데이터 묶음 (최대 데이터 수)이있는 경우 가장 높은 개인 가치가 기록 된 요일을 선택하고 싶습니다.
위에서 주어진 예제 데이터 프레임에서는 12 월 7 일로 남았습니다 (12 월 5 일과 같이) 4 개의 데이터 포인트가 있지만이 두 날짜 (10) 중에서 가장 높은 값이 기록됩니다.