0
파이프 라인을 사용하여 로지스틱 회귀를 계산했습니다. 로지스틱 회귀를 피팅하기 전에Spark : 파이프 라인 모델에서 ML 로지스틱 회귀 모델에 대한 요약 요약
나의 최근 몇 줄 : 다음
from pyspark.ml.feature import VectorAssembler
from pyspark.ml.classification import LogisticRegression
lr = LogisticRegression(featuresCol="lr_features", labelCol = "targetvar")
# create assember to include encoded features
lr_assembler = VectorAssembler(inputCols= numericColumns +
[categoricalCol + "ClassVec" for categoricalCol in categoricalColumns],
outputCol = "lr_features")
from pyspark.ml.classification import LogisticRegression
from pyspark.ml import Pipeline
# Model definition:
lr = LogisticRegression(featuresCol = "lr_features", labelCol = "targetvar")
# Pipeline definition:
lr_pipeline = Pipeline(stages = indexStages + encodeStages +[lr_assembler, lr])
# Fit the logistic regression model:
lrModel = lr_pipeline.fit(train_train)
그리고 나는 모델의 요약을 실행하려고. 그러나, 아래의 코드 라인 :에
trainingSummary = lrModel.summary
결과 : 'PipelineModel'개체가 어떤 속성 '요약'이없는
보통에서 회귀의 모델에 포함되어있는 하나의 요약 정보를 추출 할 수있는 방법에 대한 조언 파이프 라인 모델?
고맙습니다.