저는 R이 매우 새롭습니다. 주로 ggplot2
라이브러리를 사용하여 통계를 시각화하는 데 사용합니다. 이제 데이터 준비에 문제가 있습니다.데이터 프레임에서 가장 높은 값과 가장 낮은 값을 가진 행을 추출하십시오.
지정된 열에서 가장 높은 값과 가장 낮은 값을 가진 데이터 프레임에서 몇 개의 숫자 (2, 5 또는 10) 행을 제거하여 다른 데이터 프레임에 넣을 수있는 함수를 작성해야합니다. 두 가지 요소의 조합 (내 경우 : 매일 및 서버).
최대 요점은 다음과 같습니다 (MWE는 esoph
예제 데이터 집합을 사용함).
esoph<-esoph[with(esoph,order(-ncontrols)) ,]
난 (각 연령대이 예에서), 각 인자 값 성/레코드를 표시 할 수있다 :
I 원하는 파라미터 (실시 예에서 ncontrols
)에 따라 프레임을 정렬 한
by(data=esoph,INDICES=esoph$agegp,FUN=head,3)
by(data=esoph,INDICES=esoph$agegp,FUN=tail,3)
기본적으로 을 참조하십시오. 가장 높은 값과 가장 낮은 값은이지만, 다른 데이터 프레임으로 추출하는 방법과 기본 값에서 제거하는 방법을 모르겠습니다.
또한 위의 예에서 하나의 요소 (연령대)의 각 값에 대한 상단/하단 레코드를 볼 수 있지만 실제로는 두 개의 값인의 각 값에 대해 가장 높고 낮은 레코드를 알아야합니다. 예를 들면 agegp
및 alcgp
이 될 수 있습니다.
위의 단계가 정상적으로 작동하는지 잘 모르겠습니까? 아마도 plyr
을 사용하면 더 잘 작동할까요? 나는 어떤 힌트라도 주시면 감사하겠습니다. 다음과 같이
그래서 당신은 단순히 데이터 프레임의 첫 번째와 마지막 X 행을 제거하고 이러한 행을 포함하는 두 번째 데이터 프레임을 만들려면? –
두 요소의 각 조합에 대한 첫 번째 및 마지막 값이 아니라 한 열의 값에 대한 최고 및 최저 값. 따라서 2 일 및 2 서버의 경우 day1에는 server1과 server2에 대해 최상위 및 최저 5, day2에는 server1과 server2의 경우 상위 5 개가 필요합니다. –