2013-09-06 2 views
0

좋아, 그래서 당신은 [말] 정수 배열의 형태로 역사적인 데이터를 가지고. 예를 들어, 이는 2 년 동안 서버 HDD의 여유 공간을 나타낼 수 있으며 각 배열 요소는 일일 샘플을 나타냅니다.간단한 추세 분석 알고리즘

데이터 (이 예에서는 자유 공간)를 사용하면에 대한 전반적인 추세를 식별 가겠어요 방법 등

하향 추세를 가지고 있지만, 또한 파일/제거 압축 된 정기 긍정적 인 스파이크가 있습니다 2 년 기간, 즉 : 데이터의 최고점과 최저점을 철저하게 깎으십시오.

이제는 A 급 통계와 통계 모듈을 학위를 썼지 만 그 이후로 7000 회 이상 잤지 만 내 뇌에서 유출되었습니다.

내가 같은 코드의 비트 후이 문제를 접근 거라고 방법에 대한 설명을 더 아니에요 ... 사전에

감사합니다!

답변

2

내가보기에 포인트를 통해이 라인을 작성하는 경우 http://en.wikipedia.org/wiki/Local_regression, http://stat.ethz.ch/R-manual 및/R-patched/library/stats/html/loess에 설명 된 일부 변형 된 황토를 사용할 것입니다. html. 기본적으로 가장 가까운 점에 가장 많은 가중치가 부여 된 점에서 해당 점 근처의 데이터 점에 대해 가중 회귀를 수행하여 특정 점에서 평활화 된 값을 찾습니다.

+0

이것은 정확하게 내가 찾고있는 것입니다. 데이터 세트에 대해 y = n.x 스타일 표현식을 정의 할 때 시각적으로 할 일을하는 방법입니다. 고맙습니다. –

5

다양한 답변을 얻을 수 있으며, 선택하는 항목은 더 구체적인 요구 사항에 따라 달라집니다. 예 :

  1. 저역 통과 필터 또는 다른 스펙트럼 분석 기술을 사용하고 낮은 주파수를 사용하여 추세를 결정합니다.

  2. "r"(시간과 값 사이의 상관 관계)을 찾는 선형 회귀 (시간/값).

  3. 마지막 "n"샘플의 이동 평균. "n"이 충분히 크다면 이것은 내가 좋아하는 것입니다. 많은 시간이 충분하기 때문에 코드 작성이 매우 쉽습니다. 그것은 위의 # 1에 대한 일종의 근사입니다.

나는 다른 이들이 될 것이라고 확신합니다.

+0

감사합니다. Nitzan. 부끄러운 나는 두 개의 게시물에 대한 답변을 수락 할 수 없습니다. 투표 ++. –