효율적으로 x1과 y의 세 열 사이에서 피어슨 r을 얻고 싶습니다.다른 열 이름을 가진 pandas 데이터 프레임에 대한 pd.corrwith
pd.corrwith()는 정확하게 동일한 열 레이블을 가진 열에 대해서만이를 계산할 수있는 것처럼 보입니다. x와 y.
다른 변수 간의 컴퓨팅 상관 관계가 공통적 인 문제라고 생각하기 때문에 이것은 약간 비현실적 인 것처럼 보입니다.
In [1]: import pandas as pd; import numpy as np
In [2]: x = pd.DataFrame(np.random.randn(5,3),columns=['A','B','C'])
In [3]: y = pd.DataFrame(np.random.randn(5,3),columns=['A','B','C'])
In [4]: x1 = pd.DataFrame(x.ix[:,0])
In [5]: x.corrwith(y)
Out[5]:
A -0.752631
B -0.525705
C 0.516071
dtype: float64
In [6]: x1.corrwith(y)
Out[6]:
A -0.752631
B NaN
C NaN
dtype: float64