이 질문은 StackOverflow 질문에 대한 연장이며 here이라고 대답했습니다.효율적으로 데이터 프레임 열의 백분율을 계산
50,000 (또는 그 이상!) 값의 벡터 내에서 각 값의 백분위 수를 계산하려는 경우와 상황이 다릅니다. 예 :
df <- data.frame(val = rnorm(n = 50000, mean = 50, sd = 20))
df$val.percentile <- sapply(X = df$val, function(x) ecdf(df$val)(x))
head(df)
각 값의 백분위 수 계산 프로세스를 최적화하는 좋은 방법이 있습니까? 기본적으로 가능한 한 효율적으로 실행 시간을 줄이고 싶습니다.
이 답변은 내 답변과 어떻게 다른가요? –
@ 42- 아니지만, 당신과 바커가 거의 같은 시간에 게시했습니다. (바커가 첫 번째입니다.) – Jaap
허, 내가 (편집을하고있을 때) 그것을 보지 못했습니다. 나는 그것이 나중에 왔다고 생각하고 있었다. –