2014-07-06 2 views
0

나는 2 개의 값 (2000 년 및 2010 년) 만있는 1980 년부터 2020까지의 연간 인구 데이터 벡터를 가지고 있으며 누락 된 데이터를 예측해야합니다. 첫 번째 생각은 na.approx를 사용하여 2000 년과 2010 년 사이에 누락 된 데이터를 채운 다음 ARIMA 모델을 사용하는 것이 었습니다. 그러나 인구가 감소함에 따라 먼 미래에는 그 가치가 부정적이되어 비논리적이되었습니다. 두 번째 생각은 누락 된 데이터를 예측하기 위해 백분율 변경으로 사용하여 실제 값 사이에 10 년 간격이 있으므로 샘플 데이터를 10으로 나눈 로그의 차이를 사용하는 것이 었습니다. 그러나 R과 통계에 익숙하지 않아 이것이 예측을 얻는 가장 좋은 방법인지 확신 할 수 없습니다. 모든 아이디어는 정말 감사하겠습니다.2 개의 값 중 보간 및 예측 R

+5

이 질문은 적절한 통계 방법을 선택하기 때문에 주제와는 거리가 떨어져 보입니다. 그것은 프로그래밍이나 R에 관한 것이 아닙니다. 이 질문은 [stats.se]와 같은 통계 포럼에 더 적합합니다. 데이터 분석에 적합한 분석이 무엇인지 알았지 만 R에서이를 수행하는 방법을 모를 경우 여기에 게시하는 것이 좋습니다. – MrFlick

+0

"* 저는 1980 년부터 2020 년 사이의 두 해의 값 (2000 년과 2010 년)을 가진 연간 인구 데이터를 가지고 있습니다."- 실제로 가지고있는 것은 연간 인구 데이터가 아니라 2 개의 데이터 포인트입니다. 그런 희박한 데이터로 합리적인 예측을하기 위해 애 쓰고 있다고 생각합니다. 그럼에도 불구하고, 이것은 프로그래밍 문제가 아니라 통계이므로 CrossValidated에 더 적합 할 것입니다. – thelatemail

답변

0

두 데이터 요소가 제공하는 선이 직관적으로 이해되지 않으므로 추가 데이터를 얻을 수 없다면 두 데이터의 평균을 사용하는 것이 좋습니다. 더 많은 연간 데이터 또는 예상되는 변동 값을 얻을 수 있다면 몇 가지 추가 분석을 수행 할 수 있습니다. 하지만 지금은 너는 좀 붙어있다.