python blaze 모듈을 사용하여 분석하는 방법에 대한 간단한 질문이 있습니다. 그래서, 나는이 코드를 할 노력하고있어 :열 사이의 상관 관계 python blaze
from blaze import SQL,Table
from sqlalchemy import create_engine
from scipy.stats import pearsonr
sql_path=r'/path/to/my/database.db'
e=create_engine('sqlite:///%s'%sql_path)
blz_sql=SQL(e,'analysis_dataframe')
blz_frame=Table(blz_sql)
blz_cols=blz_frame.columns
corr=pearsonr(blz_frame[blz_cols[0]],blz_frame[blz_cols[10]])
print(corr)
을 그리고 여기 내가이 오류가있어 : 어떤 불꽃 문서를 읽고 나면
TypeError: len() of unsized object
을, 내가 문제가 불꽃 열을 변환하는 방법에 대한 것을 발견 이 같은 일부 구조 :
import pandas as pd
from blaze import into
df=into(pd.DataFrame,blz_frame[blz_cols[0]]
그러나이 변환 속도가 느린 열 목록에 pearsonr의 반복 계산을합니다. 그렇다면 어떻게 blaze 열을 np.array로 변환하여 pearsonr 또는 statsmodels.api.Logit (blz_frame.y, blz_frame [[train_cols])와 같은 계산을 할 수 있습니까?) 의미가있는 경우, 파이썬 3.4에 대한 아나콘다를 사용하여 m, 화재의 내 버전 : scipy.stats
같은
import blaze
print(blaze.__version__)
#returns 0.6.3
답변 해 주셔서 감사합니다. 이제 ** into ** 함수를 통해 blaze 배열과 ndarray 사이의 간단한 변환을 사용합니다. 이 경우 ndarray 로의 변환이 더 나은 것으로 보입니다. – IPolar