2017-05-10 2 views
0

POSIX 타임 스탬프 목록이 있습니다 (트윗 데이터 세트). 특정 주간 기간 (금요일 정오 - 금요일 정오)을 선택하고 현재 시스템 시간 (예 : 수요일, 16pm)과 기간 종료 사이에 게시 된 트윗의 수를 계산하고 싶습니다.R에 특정 날짜가없는 요일 R

이 코드는 현재 시간이 항상 history보다 "높기"때문에 분명히 작동하지 않습니다.

time.now=as.POSIXct(Sys.time()) 
sum(data$week==15 & data$time > time.now) 

시작하고 금요일 정오에 종료 만 시간과 요일을 지정 것이다 날짜에 얽매이지 형식으로 내 데이터를 변환하는 방법이 있나요?

감사합니다!

+1

죄송합니다. 원하시는 것이 명확하지 않습니다. 일요일 자정 대신 금요일 정오에 시작되도록 '주'를 재정의하려고합니까? 그리고 현재의 날짜부터 '주'의 끝까지 각각의 새로운 '주'를 살펴보십시오. 2 주를 다루는 몇 가지 간단한 예제 데이터는 적절한 대답을 얻는 데 정말로 도움이됩니다. – thelatemail

답변

1

재현 가능한 예제를 제공하지 않으므로 가능한 한 간단하게 설명하려고합니다. 데이터 세트의 작은 섹션을 추가해야합니다.

당신은 당신의 처음과 마지막 포인트는 첫째 금요일 2017과 금요일 예컨대 : 정오 이번 주에 무엇인지 정의 할 수 있습니다 :

"나는 특정 주 긴 기간을 선택합니다."

그런 다음 당신은 넣어 절단 사용할 수 있습니다

f1 <- strptime("2017-01-06 12:00", format = "%Y-%m-%d %H:%M", tz = "UTC") # first Friday 2017 
f2 <- strptime("2017-05-12 12:00", format = "%Y-%m-%d %H:%M", tz = "UTC") # this week 

그런 다음

seq <- seq.POSIXt(f1, f2, by = "week") 

"현재 시스템 시간 사이에 출판되었다 ​​얼마나 많은 트윗 카운트"금요일

금요일에서 POSIXt의 시퀀스를 생성 짹짹 (당신이 금요일부터 금요일까지 얼마나 많은 돈을 쏟아 붓는 지)을 쓰레기통에 넣으십시오. 예 :

cut(dataset, breaks = seq, labels = 1:length(seq), right = TRUE) 

마지막으로 빈으로 그룹화하고 발생을 계산해야합니다. 이것이 원하는 것입니까? 희망이 도움이됩니다.