달 단위로 OLS를 실행하고 있습니다. 단일 제품에 대해서는 정상적으로 작동하지만 데이터 프레임에는 많은 제품이 포함되어 있습니다. groupby 객체를 만들면 OLS에서 오류가 발생합니다.statsmodels에서 groupby로 OLS를 적용하는 방법
linear_regression_df:
product_desc period_num TOTALS
0 product_a 1 53
3 product_a 2 52
6 product_a 3 50
1 product_b 1 44
4 product_b 2 43
7 product_b 3 41
2 product_c 1 36
5 product_c 2 35
8 product_c 3 34
from pandas import DataFrame, Series
import statsmodels.api as sm
linear_regression_grouped = linear_regression_df.groupby(['product_desc'])
X = linear_regression_grouped['period_num']
y = linear_regression_grouped['TOTALS']
model = sm.OLS(y, X)
results = model.fit()
그리고 나는 sm.OLS에이 오류가() 라인 :
ValueError: unrecognized data structures: <class 'pandas.core.groupby.SeriesGroupBy'>
그래서 난 내 dataframe을 통해 이동하고 각 product_desc에 대한 sm.OLS()를 적용 할 수있는 방법? 당신은 이런 일을 할 수