저는 R이 처음이에요. 저는이 문제에 대해 꽤 오랜 시간을두고 있습니다. 'dplyr'패키지를 사용하여 십진수 또는 4 분위수를 만들려고 할 때마다 십진수가 더 적은 수의 그룹으로 병합됩니다. Like 나는 10 개 그룹을 원하지만 6, 4 또는 때로는 3 개 밖에 얻지 못합니다. 덜 데이터가 있으면 R이 작은 십진법을 그룹화/병합하려고합니다. 하지만이 문제를 피하고 싶습니다. 도와주세요! 감사합니다.R에서 십진수의 자동 병합을 피하는 방법은 무엇입니까?
코드는 다음과 같습니다 R은 작은 분위를 병합하기 때문에 여기에서
mydata <- data.frame(col1= c(0,00,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,5,3,12,5,65,23,65984,21,5469,321,6,100,200,300,400,500,600,700,800,900,1000,1100,1200,1300,1400,1500,5233,18000))
DecLocations <- quantile(mydata$col1, probs = c(0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9))
mydata$decile <- findInterval(mydata$col1,c(-Inf,DecLocations, Inf))
require(dplyr)
mydata$decile<-factor(mydata$decile)
decile_grp<-group_by(mydata,decile)
decile_summ_test<-summarize(decile_grp, total_cnt=sum(col1))
decile_summ_test<-arrange(decile_summ_test, desc(decile))
View(decile_summ_test)
는 난 단지 첫 6 분위를 얻고있다. 이것이 내가 여기서 피하려고하는 것입니다. 나는 그들이 정말로 작은 숫자를 가지고 있다고해도 10 개의 십 분위수를 모두 얻길 기대하고 있습니다.
최소 재생산 가능한 예제? – CPak
문제를 설명하고 출력으로 기대하는 것을 보여주는 간단한 데이터 예제를 제공해야합니다. 주석에 코드를 추가하지 마십시오. 오히려 코드/예제/업데이트로 원래 게시물을 수정하십시오. – CPak
@CPak 지금 완료했습니다! – PerryThePlatipus