답변

1

모든 DataFrame 지정된 데이터 불쾌감 데이텀을 대체 할 수있는 정적 "더미 데이터"또는 replace과 불쾌감 데이텀을 채울 수 불쾌감 레코드 (전체가 아니라 열) filldrop 수 DataFrameNaFunctions을 이용할 수있다.

https://spark.apache.org/docs/2.1.1/api/scala/#org.apache.spark.sql.DataFrameNaFunctions

scala> df.na 
res20: org.apache.spark.sql.DataFrameNaFunctions = [email protected] 

scala> df.na. 
drop fill replace 
+0

어떤 전략에는 3 중 추천? 평균 값으로 채우기/바꾸기는 어떻습니까? – Gevorg

+0

그것은 그 자체의 해답이 될만한 질문입니다 [그리고 토론] ... 파이썬/팬더와 관련된 토론은 다음과 같습니다 : http://stackoverflow.com/questions/27824954/how-to-handle-missing-nans-for- machine-learning-in-python # 27825523 – Garren

관련 문제