숫자

2016-06-29 3 views
2

나는 다음과 같은 경우 이해하려고 노력하고 있습니다 :숫자

  1. 내가 만들 입력 데이터 X (64)과 함께 기반으로하는 새로운 xgbost DMatrix

    xgX = xgb.DMatrix(X, label=Y, missing=np.nan)

  2. 기능 enter image description here

  3. 나는 마법 여기서 뭐 무엇 55 개 기능 enter image description here

와 함께 새로운 DMatrix있어? 어떤 조언도 좋을 것입니다!

+0

내 질문을 'DataScience stack' http://datascience.stackexchange.com/으로 옮길 방법이 있습니까? – SpanishBoy

답변

3

xgboost issue #1223

를 살펴 보자는 khotilov는 코멘트를한다 :

CSR에 대한 문제는 당신이 마지막에 완전 스파 스 열이있을 때, 당신은 그들이 존재하는지 알아낼 수 있다는 것입니다 CSR의 지표 및 지침을 살펴보십시오.

이것의 결과는 X, XGDMatrixCreateFromCSR에서 DMatrix을 생성하는 기능은, 귀하의 경우 9 열입니다 끝에 빈 열을 고려하지 않는다는 것입니다. 귀하의 케이스에서 그 사실을 확인하고 실제로 X에 64 개의 기능이 있는지 확인하십시오.