나는 타이타닉 데이터 세트를 연구 중이다. 나는 CABIN 칼럼에서 공란을 채우려고한다. 나는 CABIN 칼럼 값으로부터 첫 글자를 추출한 다음, CABIN_NEW 칼럼에 그것들을 넣었다. 그 후에는 예측을 위해 rpart
을 사용하지만, 아래 코드를 실행할 때마다 R은 많은 시간을 소비합니다 (아직 한 번 완료하지 않았고 매회 종료해야합니다).R Studio에서 rpart 실행
DATAset에는 1309 개의 행이 있으며 사용중인 열은 아래 코드에 있습니다. 내가 사용하고있는 시스템은 4기가바이트 램, I5 프로세서와 윈도우 당신이 요인 변수를 많이 사용하는 것을 볼 수 7.
combifit <- rpart(Cabin_New ~ Pclass + Sex + Age + SibSp + Parch + Fare + Embarked + Title
+ FamilySize + Surname + FamilyID,
data = combi[!is.na(combi$Cabin_New),], method = 'class')