Cox 모델을 만들고 검증하기위한 두 가지 데이터 집합 (교육 및 유효성 검사)이 있습니다.외부 데이터를 사용하는 생존 모델 유효성 확인
훈련 데이터 세트를 사용하여 단계별 선택 방법을 사용하여 cox 모델을 장착했습니다.
모델의 중요한 변수는 유효성 확인 모델에 포함 된 유일한 변수입니다. 이것이 올바른 접근 방법입니까?
모델을 검증하면서 변수가 유효성 검증 모델에서 중요하지 않으며 cox 모델의 가정이 유효하지 않음을 확인했습니다 (유효성 검증 데이터에 대한 가정을 점검 함). 변수가 중요하지 않고 유효성 검사 데이터의 모델 가정에 대한 문제를 수정하는 데 앞서야한다는 사실을 무시해야합니까?
세 번째로, 훈련 및 유효성 확인 데이터에서 나는 세 가지 그룹으로 '치료'변수가 있습니다. 훈련에서 표준, 신약 및 혼합물이 그룹이며, 검증 데이터에서 그룹은 표준, 신약 및 X (훈련 데이터의 혼합과 다른 치료법)입니다. 이 변수를 두 모델에 모두 포함하는 것이 맞습니까? 아니면 일치하지 않는 그룹을 제거해야합니까? 학습 데이터와 X의 유효성 검사 데이터를 혼합하거나 그와 같이 작동해야합니까? 이것이 내 분석에 어떤 영향을 미치는지 확신 할 수 없습니다.
답장을 보내 주셔서 감사합니다.