2016-08-11 6 views
0

임의의 포레스트 분류기를 사용하여 데이터 세트를 모델링했습니다. 임의의 포리스트에서 선택한 기능을 인쇄하고 싶습니다. 다음과 같이 내가 feature_importances_을 사용하고 있습니다 :임의의 포리스트에서 모델링 한 후 기능을 인쇄하는 방법은 무엇입니까?

modelRF.feature_importances_ 

를하지만이 같은 오류를 보여주고있다 :

AttributeError: 'RandomForest' object has no attribute 'fit'

: 또한 "맞는"방법을 사용하여

NameError: name 'feature_importances_' is not defined

,이 같은 오류를주고있다

다음은 임의의 포리스트 분류 자에서 사용되는 매개 변수입니다.

(data, x_cols, y_col, num_trees, method, impurity, max_depth=10, min_instance_per_node=20, min_information_gain=0.01, max_bin=32, feature_subset_strategy=u'auto', seed=123, async_execution=False) 

임의의 포리스트를 사용하여 선택한 기능을 인쇄하려고합니다.

위의 방법을 임의의 포리스트에서 사용할 수 있도록 추가로 정의해야 할 필요가 있습니까? (adatao/arimo 패키지를 사용하여 분산 플랫폼에서 RF를 모델링했습니다).

답변

0

arimo 패키지에는 variable_importance이라는 모듈이있어 무작위 포리스트 분류기에서 선택한 기능을 제공합니다.

그것은 variable name, importance score

importance score> 0.0 랜덤 포레스트 분류기에 의해 선택된 기능으로 갖는다 variable name와 팬더 dataframe을 줄 것이다. 파이썬에서 분산 플랫폼 용 arimo 패키지로 사용할 수 있습니다.

model.feature_importances_ 

다른 패키지 달리 사용할 수 있습니다.

관련 문제