1

주택 가격을 예측할 수있는 기존 모델이 단순 선형 회귀 분석을 사용합니다. 입력으로 나는 날짜와 산출이 가격이다.단순 선형 회귀의 결과가 다 변수/다중 reg보다 우수함

전반적인 결과를 향상 시켜서 하나 이상의 기능을 추가하고 싶었습니다. 새로운 기능은 예상 속성으로부터의 거리입니다.

문제는 다중/다 변수 회귀가 단순 회귀보다 조금 나쁘다는 점입니다. (모든 데이터는 정규화 됨)

왜 이런 일이 발생하며 어떻게 접근 할 수 있습니까?

답변

1

은 나열하려면 가능한 이유 수십 있습니다 몇 :

  • 새로운 기능은 거의 당신이 예측하려고하는 것과 상관 관계가있는 경우 - 효율적 더 기대할 수 없다, 따라서 시스템에 잡음을 주입하는 성능
  • 당신은 당신이 선형 모델을 사용하고 있기 때문에 더 많은 기능이 새로운 기능은 아주 좋은 예측 인자이지만, 그 관계가 종속에을 선형되지 않은 경우에도, 더 힘들어 문제
  • 으로 이어질 수 있습니다 거의 데이터 포인트가있는 경우 변수 - 모델이 실패합니다. 등의 아니라
  • 선형 회귀는 매우 순진 모델, 심지어 능선 /입니다 완전히 (나쁜 기능을 잘 다루고 있기 때문에 특히 올가미)
을 결과 변경 될 수 있습니다 올가미 회귀
관련 문제