0
Spark MLlib에서 의사 결정 트리를 사용할 때 누락 된 숫자 기능을 어떻게 처리합니까?Spark MLlib 의사 결정 트리를 사용할 때 누락 된 숫자 기능을 처리하는 방법은 무엇입니까?
누락 된 기능을 다른 값의 평균으로 바꾸는 것을 고려하고 있지만 모델 품질에 어떤 영향이 있는지 잘 모르겠습니다. Spark MLlib는이 공통적 인 문제에 대한 지원을 제공합니까?
어떤 전략에는 3 중 추천? 평균 값으로 채우기/바꾸기는 어떻습니까? – Gevorg
그것은 그 자체의 해답이 될만한 질문입니다 [그리고 토론] ... 파이썬/팬더와 관련된 토론은 다음과 같습니다 : http://stackoverflow.com/questions/27824954/how-to-handle-missing-nans-for- machine-learning-in-python # 27825523 – Garren