저는 실제로 전기 차량과 R의 시간차 예측 모델을 연구 중입니다. 데이터로서 2 년 전에 출발 한 역사를 가지고 있습니다. 날짜 (일)를 입력으로하여 예측 모델을 만들고 모델의 출력이 출발 시간이 될 것입니다. I가 0과 같은 "이탈있다"(1 클러스터링 한 바와 같이 문제를보고하려고전기 자동차의 예상 출발 시간 모델
- : 단차 두 시작 (>
18h00
18h35
예) 사이의 하나의 시간으로 간주 될 수있다 "none") randomForest 모델을 입력으로 (하루와 시간을 입력으로, 1이나 0을 출력으로) 적용했지만 모델이 출력과 입력 사이의 링크를 찾지 못했고, 하루 또는 시간을 wathever하면 모델에서이를 제공합니다 결과 : "1) 루트 13561 730 0 (0.9461 0.0538) *". 마음에 온
- 또는 nnet하지만 헛된 나는 어떤 결과
다른 아이디어는 아리마로, 시계열로 작업하는 것입니다
시하지 않았다 : 당신은, 아래의 방법의 이미지를 찾을 수를 데이터가 제공됩니다. 그러나 2 년의 운전 (2014,2015,2016)에 해당하는 1460 건 이상의 출발 이벤트가 있습니다.
는 두 가지 방법에 대한 어떤 생각?
아리마는 데이터와 함께 작동하지 않습니다 각 기간마다 여러 번 출발해야하기 때문입니다. 평균 출발 시간을 예측하려고합니까 (평균 인 경우 평균, 평균, 중간, 모드)? 또는 출발 횟수를 예측 한 후에 당신이 있습니까? – MorganBall
실제로 저는 출발 시간을 확률로 예측하려합니다. 예를 들어, 입력 "목요일"로, 모델은 우리 고객이 오전 5시 (45 %), 오후 7시 (55시)에 떠날 것임을 말해 줄 수 있어야합니다. %) and ... etc 내가 분명히 설명하기를 바란다. 감사합니다! – karim