2017-12-06 4 views
0

파이프 라인을 사용하여 로지스틱 회귀를 계산했습니다. 로지스틱 회귀를 피팅하기 전에Spark : 파이프 라인 모델에서 ML 로지스틱 회귀 모델에 대한 요약 요약

나의 최근 몇 줄 : 다음

from pyspark.ml.feature import VectorAssembler 
from pyspark.ml.classification import LogisticRegression 
lr = LogisticRegression(featuresCol="lr_features", labelCol = "targetvar") 
# create assember to include encoded features 
    lr_assembler = VectorAssembler(inputCols= numericColumns + 
           [categoricalCol + "ClassVec" for categoricalCol in categoricalColumns], 
           outputCol = "lr_features") 
from pyspark.ml.classification import LogisticRegression 
from pyspark.ml import Pipeline 
# Model definition: 
lr = LogisticRegression(featuresCol = "lr_features", labelCol = "targetvar") 
# Pipeline definition: 
lr_pipeline = Pipeline(stages = indexStages + encodeStages +[lr_assembler, lr]) 
# Fit the logistic regression model: 
lrModel = lr_pipeline.fit(train_train) 

그리고 나는 모델의 요약을 실행하려고. 그러나, 아래의 코드 라인 :에

trainingSummary = lrModel.summary 

결과 : 'PipelineModel'개체가 어떤 속성 '요약'이없는

보통에서 회귀의 모델에 포함되어있는 하나의 요약 정보를 추출 할 수있는 방법에 대한 조언 파이프 라인 모델?

고맙습니다.

답변

1

그냥 단계에서 모델을 얻을 :

lrModel.stages[-1].summary 

를 모델은 이전 파이프 라인에 교체 할 경우 -1 인덱스와 함께.