2016-10-06 2 views
0

저는 실제로 전기 차량과 R의 시간차 예측 모델을 연구 중입니다. 데이터로서 2 년 전에 출발 한 역사를 가지고 있습니다. 날짜 (일)를 입력으로하여 예측 모델을 만들고 모델의 출력이 출발 시간이 될 것입니다. I가 0과 같은 "이탈있다"(1 클러스터링 한 바와 같이 문제를보고하려고전기 자동차의 예상 출발 시간 모델

  1. - : 단차 두 시작 (>18h0018h35 예) 사이의 하나의 시간으로 간주 될 수있다 "none") randomForest 모델을 입력으로 (하루와 시간을 입력으로, 1이나 0을 출력으로) 적용했지만 모델이 출력과 입력 사이의 링크를 찾지 못했고, 하루 또는 시간을 wathever하면 모델에서이를 제공합니다 결과 : "1) 루트 13561 730 0 (0.9461 0.0538) *".

  2. 마음에 온

    다른 아이디어는 아리마로, 시계열로 작업하는 것입니다

  3. 또는 nnet하지만 헛된 나는 어떤 결과

시하지 않았다 : 당신은, 아래의 방법의 이미지를 찾을 수를 데이터가 제공됩니다. 그러나 2 년의 운전 (2014,2015,2016)에 해당하는 1460 건 이상의 출발 이벤트가 있습니다.

time departure

는 두 가지 방법에 대한 어떤 생각?

+0

아리마는 데이터와 함께 작동하지 않습니다 각 기간마다 여러 번 출발해야하기 때문입니다. 평균 출발 시간을 예측하려고합니까 (평균 인 경우 평균, 평균, 중간, 모드)? 또는 출발 횟수를 예측 한 후에 당신이 있습니까? – MorganBall

+0

실제로 저는 출발 시간을 확률로 예측하려합니다. 예를 들어, 입력 "목요일"로, 모델은 우리 고객이 오전 5시 (45 %), 오후 7시 (55시)에 떠날 것임을 말해 줄 수 있어야합니다. %) and ... etc 내가 분명히 설명하기를 바란다. 감사합니다! – karim

답변

0

당신이 언급 한 접근법에서 모델은 전체 2 년 동안 평균 출발 시간 이상을 배울 수 없을 것입니다.

분명히 더 정교한 일정 변수를 모델 입력으로 만들어야합니다.당신은 추가 할 수 있습니다 : 오늘의

  • 시간를 (숫자 OU 팩터) 일 (평일/토요일/일요일)의

  • 유형을

  • 공휴일/방학

그리고 내 경험상 보통 약간의 영향을주는 기후 데이터와 함께 사용하지 마십시오.

  • 비 예측

  • 실외 온도 당신이 느껴지 추가 할 수 있습니다 또한

변수 :

  • 전날 사용 (출발의 수)

  • 사용 다른 차량들 중

선형 모델을 사용하면 여러 상호 작용을 테스트해야합니다. 하지만 기계 학습 모델 (앙상블 알고리즘의 신경 네트워크) 어쨌든

여기에 좋은 결과를 yiels 수, 나는 후 질문의이 종류는 더 크로스 인증 됨 웹 사이트에 대해 표시됩니다 추측

상기와 같이