아주 SciKit 및 일반 파이썬으로 학습 선형 대수/기계 새로운, 그래서 나는 다음과 같은 해결하기 위해 수없는 것 : 방법 : SciKit 선형 회귀에 'ValueError를가 정렬되지 셰이프가'
내가 훈련 세트가 연속 및 이산/범주 형 값을 모두 포함하는 테스트 데이터 세트를 제공합니다. CSV 파일은 Pandas DataFrames에로드되고 모양이 일치하며 (1460,81) 및 (1459,81)입니다. 그러나 Pandas' get_dummies을 사용한 후에는 DataFrames의 모양이 (1460, 306) 및 (1459, 294)로 변경됩니다. 따라서, SciKit Linear Regression 모듈을 사용하여 선형 회귀 분석을 수행하면 306 개의 변수에 대한 모델이 작성되고 294 개의 변수로 모델을 예측하려고 시도합니다. 그러면 당연히 다음과 같은 오류가 발생합니다.ValueError: shapes (1459,294) and (306,1) not aligned: 294 (dim 1) != 306 (dim 0)
어떻게 이러한 문제를 해결할 수 있습니까? 나는 어쨌든 (1459, 294) 다른 하나와 일치하도록 모양을 바꿀 수 있을까요?
덕분에 나는 나 자신을 분명히했습니다 :) 범주 데이터를 처리 할 때