0
코드에서 많은 사용자 정의 데이터 프레임 변환이 있습니다. 첫 번째 그룹은 간단 캐스팅입니다 :Spark (Java) 기존 UDF 변환에서 사용자 정의 변압기 만들기
dframe = dframe.withColumn("account_number", col("account").cast("decimal(38,0)"));
두 번째 그룹은 UDF-변환입니다 : 그들은 모두 그렇게 노력하고 있습니다
(UDF1<Timestamp, Integer>) s -> s.toLocalDateTime().extractMonth()
dframe = dframe.withColumn("month", callUDF(("monthExtractor"), dframe.col("trans_date_t")));
코드가 테스트입니다. 하지만 최종 목표는 재사용 할 수 있도록 ML 파이프 라인을 코드에서 생성하는 것입니다. 위의 코드를 다양한 트랜스포머로 변환 할 수있는 방법이 있습니까?
가능한 [UDF에서 사용자 지정 변환기를 만드는 방법?] (http://stackoverflow.com/questions/35180527/how-to-create-a-custom-transformer-from-a-udf) –
의 가능한 복제본 예제를 찾았습니다. http://supunsetunga.blogspot.ru/2016/05/custom-transformers-for-spark.html –