2017-04-06 2 views
0

은 내가 아래의 코드를 시간 단위로 그룹 내 데이터를 시도하고 R,에 내 데이터를 읽고 :데이터를 시간 단위로 그룹화하려면 어떻게합니까?

tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE) 

tweets %>% 
group_by(format(Time, "%H"), Word) %>% 
summarise(count=n()) 

이 코드를 실행하면 내가 얻을 수없는 오류 (아래 그림 참조)을 얻을 내 주위에 머리 :

  • "오류를 mutate_impl에 (.DATA, 도트) : 잘못된 인수 '트림'"

누군가가 나에게이 문제를 극복 할 수 있을지가 궁금하세요? https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing

답변

2

이 나를 위해 일한 :하십시오 POSIXct로 변환

tweets %>% 
    mutate(Time = as.POSIXct(Time)) %>% 
    group_by(lubridate::hour(Time), Word) %>% 
    summarise(count=n()) %>% 
    arrange(desc(count)) 

당신이 lubridate의 시간 기능을 사용 할 수있는 데이터 세트의

감사 제임스

샘플이 링크를 통해 액세스 할 수 어느 것이 편리합니다.

+0

정말 고맙습니다. 도움을 주셔서 감사합니다 .-- 나는이 일을하기 위해 나이를 먹었습니다. @ Adrian Martin 윤활유를 사용하여 dplyr를 사용하는 방법에 대해 자세히 알아 보려면 좋은 자료를 알고 있다면 궁금하십니까? – jr134

+0

나는 그것들을 별도로 배웠다. dplyr에 익숙해 지려면 조금 시간이 걸립니다. Lubridate는 배우기가 매우 간단합니다. 데이터에서 항상 "str()"을 호출하여 모든 클래스가 무엇인지 알아냅니다. dplyr의 RStudio 치트 시트를 사용하는 것이 좋습니다 : https://www.rstudio.com/resources/cheatsheets/. –

관련 문제