2011-02-25 4 views
4

데이터가 누락 된 데이터 세트를 다루고 있으며 앞으로, 뒤로 및 간격을 채울 수 있어야합니다. 예를 들어 2000 년 1 월 1 일부터 2010 년 12 월 31 일까지의 데이터가 있고 누락 된 날짜가있는 경우 사용자가 누락 된 데이터 포인트 이전, 끝나기 또는 끝나는 시간대를 요청하면 " 이 누락 된 값을 채우십시오.누락 된 데이터를 채우기위한 방법론 또는 알고리즘

데이터를 채우는 개념을 언급하는 적절한 용어가 있습니까? 대체는 하나의 용어이며, 그것이 "그"용어인지는 모르겠다. I는 등 중간/평균/이동 평균을 이용하여 최종 측정 누락 된 데이터에 충전 & 방법 (용도, 2 개 공지 숫자 사이에 다수의 알고리즘을 거기 추정

사람이 문제에 대한 적절한 용어 알 당신이 찾고있는 용어는 interpolation입니다

+1

"보간법"이란 용어를 찾으십니까? –

+1

"외삽 법"? – Howard

답변

2

를이 주제에 온라인 리소스, 또는 이상적으로 링크 (바람직하게는 C#을하지만, 모든 언어는 유용 할 것이다) 어떤 알고리즘의 소스 구현을 엽니 다. (의무 위키 링크)

C# 솔루션을 요구하고 있습니다. 데이터 세트를 사용하지만이 작업을 the database level like this에서 수행해야합니다.

C#에서는 간단한 시작과 끝 값을 최소/최대 값으로 사용하여 연속 된 날짜 배열을 만들 수 있습니다. 그런 다음 해당 배열을 사용하여 데이터 세트에 날짜 배열의 일치하는 날짜가없는 행을 삽입하여 데이터 세트에 "보간 된"날짜 값을 병합합니다.

여기에 SO post이 필요합니다. 누락 날짜를 C#으로 보간합니다. 수락 된 해결책은 없지만 질문을 읽고 대답을 시도하면 다음에해야 할 일이 무엇인지 알 수 있습니다. 예 : Ticks (긴 값 형식)의 관점에서 DateTime 데이터를 사용한 다음 해당 데이터에 보간 체계를 사용합니다. 보간 된 long 값을 DateTime 값으로 변환합니다.

2

사용하는 알고리즘은 데이터 자체, 사용 가능한 데이터와 비교 한 갭의 크기 및 기존 데이터를 기반으로 한 예측 가능성에 따라 크게 달라집니다. 또한 실제 데이터가 특정 범주에 걸쳐 우주와 동일한 분포를 반영하지 않을 때 통계에서 흔히있는 것처럼 누락 된 부분에 대해 알고있는 다른 정보를 통합 할 수 있습니다.

선형 및 입방 보간은 구현하기 어려운 전형적인 알고리즘입니다.이를 시도해보십시오.

는 여기에 몇 가지 코드를 좋은 입문서이다 :

http://paulbourke.net/miscellaneous/interpolation/

링크에서 논의의 맥락 그래픽이지만 개념이 보편적으로 적용 할 수 있습니다.