2012-06-20 3 views
1

나는 두 시계열 데이터과 같이 주어진 피어슨 상관 관계를 구현하기 위해이 웹 사이트 http://blog.chrislowis.co.uk/2008/11/24/ruby-gsl-pearson.html의 코드를 사용하고 있습니다 :피어슨 상관 관계를 시계열을 사용하여 플로팅하는 방법은 무엇입니까?

require 'gsl' 

    pearson_correlation = GSL::Stats::correlation(
    GSL::Vector.alloc(first_metrics),GSL::Vector.alloc(second_metrics) 
)  

이것은 -0.2352461593569471와 같은 수를 반환합니다.

저는 현재 highcharts 라이브러리를 사용하고 있으며 두 세트의 timeseries 데이터를 제공하고 있습니다. 두 세트에 대해 유한 한 시계열이 있다고 가정하면이 곡선의 기울기를 보여주는 세 번째 시계열을 만들기 위해이 숫자 (-0.2352461593569471)로 무엇을 할 수 있습니까? 누구든지 올바른 방향으로 나를 가리킬 수 있다면 정말 고마워!

+0

귀하의 데이터는 어떻게 생겼습니까? 너는 무엇을 보여 주려고 하는가? – naught101

답변

1

아니요, 상관 관계가 가장 잘 맞는 선의 기울기에 대해 알려주지 않습니다. 하나의 변수 (또는이 경우에는 하나의 시계열)에서 얼마나 많은 가변성이 다른 변수에 의해 설명 될 수 있는지 대략적으로 알려줍니다. 여기에 합리적으로 좋은 설명이 있습니다 : http://www.graphpad.com/support/faqid/1141/.

특정 경우의 데이터 처리 방법은 달성하고자하는 것에 크게 의존합니다. 변수 X가 변수 Y를 발생시키는 것을 보여 주려고합니까? 그렇다면 시계열을 삭제하고 데이터를 쌍 값으로 취급하고 선형 회귀를 사용하면됩니다. X와 Y가 시간이 지남에 따라 어떻게 변하는 지 모델을 찾으려고한다면, multivariate linear regression을 볼 수 있습니다 (저는 이것에 익숙하지 않습니다).

관련 문제