2017-04-05 2 views
0

나는 예를if 문을 사용하여 데이터를 분할하는 방법은 무엇입니까?

Student  GPA 
Jim   3.00 
Tom   3.29 
Ana   3.99 

등을 위해, 학생, GPA들을 포함 R에 데이터 세트를 가지고있다.

빈에 넣는 열이 필요합니다. 예를

Student  GPASplit 
Jim   3.0-3.5 
Tom   3.0-3.5 
Ana   3.5-4.0 

에 나는 모든 쓰레기통 실제 GPA에 따라 구분하는 GPA에 대한 통계를 취하려고 할 때 때문에. 예를 들어, 3.5보다 높은 학생 수, 3.0-3.5 사이의 GPA 등의 비율을 찾으려고합니다. 하지만 실제 GPA와 관련하여 백분율을 얻었으며 GPA가 다른 모든 데이터 요소가 4000 개일 때 GPA가 3.5 이상인 숫자가 얼마나되는지 파악하기 란 어렵습니다. 이게 말이 돼? 미안해.

+3

당신이 cut' –

+0

'사용하려고 했습니까 http://stackoverflow.com/questions/23664942/r-split-data-into-categories – jogo

답변

5

cut() 함수를 사용하여 정의한 bin으로 데이터를 분할 할 수 있습니다. 경계에 정확하게 떨어지는 값에 대해서는 신중해야하며 원하는 방식으로 처리되는지 확인해야합니다. 귀하의 예제 데이터와 함께 :

> df$GPA_split = cut(df$GPA, breaks = c(3.0, 3.5, 4.0), include.lowest = TRUE) 
> df 
    Student GPA GPA_split 
1  Jim 3.00 [3,3.5] 
2  Tom 3.29 [3,3.5] 
3  Ana 3.99 (3.5,4] 
# Count values in each bin 
> table(df$GPA_split) 

[3,3.5] (3.5,4] 
     2  1 
관련 문제