그래서 9031 개의 관측 값을 갖는 5 열의 데이터 프레임이 있습니다. 한 열의 각 레코드는 열의 모든 값에 대한 백분위 수 순위입니다.n 개의 레코드를 얻기 위해 5 열의 데이터 프레임에서 가장 높은 임계 값 찾기
저의 목표는 n 개의 레코드를 얻기 위해 다섯 개의 열 모두에 적용 할 최고 백분위 임계 값을 찾는 것입니다.
예를 들어, 데이터 레코드의 레코드 수를 1000 레코드로 줄이는 것이라고 가정 해 봅시다. 1000 레코드를 얻으려면 5 열 모두에 적용해야하는 최고 임계 값은 얼마입니까?
Variance_Five_Metrics$Zips medium medium.1 medium.2 medium.3 medium.4
1 00501 0.8395527 0.8671243 0.9894807 0.6567379 0.45875318
2 00544 0.8075518 0.8687853 0.9883734 0.6345920 0.45100210
3 01432 0.6124460 0.2460414 0.9701030 0.9103089 0.17107740
4 01434 0.7869560 0.3000775 0.9268077 0.8760935 0.11859152
5 01450 0.6642675 0.2451556 0.9919167 0.9585871 0.09600266
그럼 내 데이터 프레임의 처음 5 개 레코드 (9031 개 레코드)가 위와 같다고 가정 해 보겠습니다. 내 df를 정확히 1000 개의 레코드로 축소하려면 5 개의 열 모두에이 컷오프 포인트 이하의 값이있는 정확히 1000 개의 레코드를 얻기 위해 5 개의 열 모두에 적용해야하는 컷오프 포인트가 무엇입니까?
나는 아마 잘 설명하지 않았지만, 나는 어떤 지침을
감사
죄송합니다, 내 dataframe의 처음 다섯 개 개의 레코드를 포함하는 내 질문에 편집. – mangodreamz
감사합니다. 지금은 훨씬 나아졌습니다. – akrun
컷오프 포인트가 모든 5 개의 열 또는 개별 열마다 하나의 컷오프 값에 대해 동일해야한다는 것을 의미합니까? –