0

PySpark를 사용하여 모델을 PMML로 내보낼 수 있습니까? 나는 이것이 Spark를 사용하여 가능하다는 것을 안다. 그러나 PySpark 문서에서 어떤 참조도 찾지 못했습니다. 그렇다면이 작업을 수행하려면 타사 Python PMML 라이브러리를 사용하여 사용자 정의 코드를 작성해야합니다.PySpark를 사용하여 PMML로 모델 내보내기

+0

지금 pyspark를 사용 PMMLs에 대한이 지원되지 않습니다. – eliasah

+0

답장을 보내 주셔서 감사합니다 – SameeraR

+0

@ 리아스아 내 질문의 두 번째 부분에 대한 통찰력을 주시겠습니까? "내가 이것을하고 싶다면 제 3 자의 파이썬 PMML 라이브러리를 사용하여 커스텀 코드를 작성해야만 하는가?" – SameeraR

답변

2

JPMML-SparkML 라이브러리를 사용하여 Apache Spark 파이프 라인을 PMML로 내보낼 수 있습니다. 또한이 라이브러리는 최종 사용자가 JPMML-SparkML-Package 프로젝트에서 "스파크 패키지"형태로 사용할 수 있습니다.

예 PySpark 코드 :

from jpmml_sparkml import toPMMLBytes 
pmmlBytes = toPMMLBytes(sc, df, pipelineModel) 
print(pmmlBytes) 
+0

좋아요. 이것을 시도 할 것입니다. – SameeraR

+0

@ user1808924 @SameeraR 언급 한 JPMML-SparkML-Package 프로젝트를 사용하여 PySpark 코드에서 pmml을 생성 할 수 있습니까? 'java.lang.IllegalArgumentException : 필드 "레이블이"존재하지 않습니다. "예외가 발생했습니다 :'pipelineModel = pipeline.fit (df)'이것은 Scala와 PySpark 코드 모두에 적용됩니다. – mrjoseph

관련 문제