2011-11-18 2 views

답변

48

R 세션이 시작될 때 또는 .R 프로필에 options(stringsAsFactors = FALSE)을 설정하십시오.

아래의 의견에서 알 수 있듯이 stringsAsFactors은 R 커뮤니티에서 논란이되는 주제입니다. 이 기본값을 찾는 것이 얼마나 까다로운지는 R을 사용하여 많은 "표준"통계 모델 (lm, glm 등)에 얼마나 많은 시간을 소비 하느냐에 달려 있습니다. 이러한 모델 피팅 및 관련 기능의 대부분은 요인 데이터 유형을 사용하여 구축됩니다.

기타 "일반"유형의 데이터 분석을 수행하는 데 대부분의 시간을 소비하는 경우이 기본값이 더 자극적 일 수 있습니다.

다음과 같은 이유 때문에 전체적으로 stringsAsFactors = FALSE을 설정하는 것은 위험한 것으로 간주됩니다. 코드를 공유 할 때 심각한 혼란을 야기 할 수 있습니다. 사실, 당신이 주로 혼자서 일하더라도, StackOverflow와 같은 온라인 커뮤니티에 참여하는 것은 R을 stringsAsFactors = FALSE과 함께 실행하는 것을 힘들 수 있습니다 : 질문에 대한 답변이 OP를 위해 작동하지 않거나 다른 사람의 오류를 복제하지 못할 수도 있습니다 봄!

물론 모든 사람들은 이러한 위험을 스스로 관리하는 최선의 방법을 스스로 선택할 수 있습니다.

+24

'.Rprofile'에서이 집합을 사용하면 코드가 더 이상 이식 가능하지 않기 때문에 조금 위험 할 수 있습니다. 많은 강의를했기 때문에 코드를 전달할 때이 옵션을 잊어 버리는 것은 너무 쉽다는 결론을 내 렸습니다. – csgillespie

+11

정말 기본해야합니다. 매우 이상하게 생겼을 때 생산성이 떨어지며, 버그 때문에 디버깅하기가 어렵습니다. 그냥 지금은 파일에서 매개 변수를 플로팅을 읽고, 그것을 잊어 버렸고, 플롯은 여전히 ​​올바른 제목과 축 설명을 표시하면서 잘못되었습니다 ... –

+0

as.data.frame() 같은 기본 데이터를 유지해야합니다 기본 데이터를 유지해야합니다 데이터 프레임에 삽입하는 객체의 구조. –

관련 문제