2012-08-24 6 views
1

눈금이 다른 두 개의 데이터 세트/곡선을 서로 연관시키는 방법, 즉 한 곡선의 y 축 범위는 (0,70000)이고 다른 곡선의 y 축 범위는 (0, 150000)입니다.). 동일한 배율 일 경우 cor() 함수를 사용할 수 있습니다. 하나의 커브가 다른 커브와 관련이 있는지/두 커브가 서로 관련되어 있는지 확인하고 싶었습니다. 어떤 아이디어?서로 다른 눈금의 두 데이터 세트를 서로 연관시킵니다.

답변

1

두 데이터 세트 간의 상관 관계를 찾고있는 경우 상관 관계의 양은 데이터 세트 범위의 차이에 의존하지 않습니다.

예를 들어, y 값의 임의 세트를 만든 다음 크기를 조정할 수 있습니다. 상관 관계는 여전히 1 :

> y <- rnorm(100) 
> y2 <- y*2 + 20 
> cor(y, y2) 
[1] 1 

더 상관 관계가없는 데이터의 경우를 보면, 상관의 양이 규모의 선형 변화에 독립적임을 표시하려면

> y3 = rnorm(100) 
> cor(y, y3) 
[1] -0.05293818 
> y4 <- y3*2 + 20 
> cor(y, y4) 
[1] -0.05293818 

그래서, 귀하의 질문에 대답하기 . 나는 함수 cor이 여전히 잘 작동해야한다고 생각한다.

0

상관 관계가 데이터의 절대 범위에 의존하지 않아야한다고 생각하지 않습니다. 하나의 데이터 세트에 상수를 곱하면 다른 데이터 세트와 동일한 범위가됩니다.

3

definition of Pearson's product moment of correlation (기본값 : cor)을 보면 선형 연산자임을 알 수 있습니다. 즉, a와 b가 상수이면 cor (aX + b, Y) = cor (X, Y)입니다. 따라서 X와 Y의 범위 차이는 중요하지 않습니다. 이 상관 관계 만이 선형 종속성을 측정한다고해도 관련이있을 수 있지만 상관 관계는 낮을 수 있습니다. 예를 들어, 관계가 비선형 인 경우이 문제가 발생할 수 있습니다.

set.seed(100) 
x <- rnorm(100) 
y <- x^2 
cor(x,y) 
# 0.1224623 
+0

두 커브 사이의 유사성을 측정하는 데 사용할 수 있습니까? 매우 다른 범위이지만 모양이 비슷한 두 개의 1-d 데이터 세트가 있다고 가정합니다. 위의 상관 관계가 그들 사이의 유사성을 측정하는 적절한 척도가 될 수 있습니까? – Kanmani

관련 문제