2017-05-24 1 views
0

나는 Lifelines의 Python에서 AalenAdditiveFitter를 사용하여 예측 모델을 구축하여 이벤트의 발생 여부와시기를 예측합니다.누적 위험 확률을 조건부/한계 확률로 변환하려면 어떻게합니까?

T (시간) 개월 C (이벤트) = 1은 '예, 0은 내가 사용하고 8 개 속성이 또한 더

없다 =. 나는 상대적으로 안정적인 모델을 구축하고 다음과 같은 방법을 사용하여 누적 위험 확률을 얻을 수 있어요

aaf = AalenAdditiveFitter(coef_penalizer=1., fit_intercept=True) 
cx1 = aaf.fit(trainX.drop(['index'], axis=1), duration_col='T', event_col='C',show_progress=True) 

:

stestXsurvived = cx1.predict_cumulative_hazard(stestX.drop(['T','C'], axis=1)) 

바로 AalenAdditiveFitter 과정에서 조건/한계 확률을 가져 오는 방법이 있나요?

그래서 조금 더 파고 나면 다음과 같이 생각할 수 있습니까?

  1. 내가
  2. 는 각 달의 조건부 확률로를 얻으려면 알렌 첨가제 모델에서 누적 위험 확률을 얻을, 난 그냥 이전 달의 차이를 취할 수 있습니다 : P (t) - P (t-1)

이이 https://quant.stackexchange.com/questions/21816/cumulative-vs-marginal-probability-of-default

이 솔루션은 매우 간단하다 확실하지에 게시 된 대답을 기반으로, 도와주세요.

답변

0

누적 위험과 제안하는 방법이 다른 경우 h (t), 위험 요소가 표시됩니다. h (t)는 이산 시간 기간에 대한 조건부 확률에 해당한다. 그러나 연속 시간 기간의 경우 h (t)는 속도 인입니다 (예 : 1보다 클 수 있음).

Aalen의 additive 모델이 semi-parametric offhand인지 여부는 기억이 안납니다. 그러나 누적 위험이있는 경우 누적 위험은 오류가 발생한 달에만 가치가 변경됩니다. 귀하의 (월 - 이전 달) 계산에 영향을 미치지는 않을 것입니다. 차이는 0이 될 것이고, 이것은 우리가 실패를 볼 때 반 파라 메트릭 기간 모델의 경우 항상 그렇습니다.

계산 능력을 절약하려면 한 번의 실패 시간 (이 t_k라고 부름)에서 누적 위험을 감수하고이 전의 마지막 실패 시간 (이 t_k-1이라고 함)에서 누적 위험을 뺍니다. 누적 된 위험이 t_k-1과 t 사이의 많은 변화를 일으키고 반 매개 변수 위험 (따라서 누적 된 위험 요소, 즉 누적 된 위험 요소)이 변경 될 경우 사용자가 얻는 답은 동일합니다. 너무) 우리가 실패를 볼 때만 갱신하면 t_k-1과 t 사이의 모든 시점은 위험이 0이어야합니다.

관련 문제