저는 영국의 프랙티스 데이터를 처방하는 데이터 프레임을 가지고 있습니다. 원래 데이터는 http://datagov.ic.nhs.uk/T201207.exe입니다. PCT와 가장 일반적인 처방 ('항목'열의 내림차순)에 따라 주문한 PCT 수준의 데이터 프레임을 작성했습니다.다른 컬럼의 인자로 컬럼에서 상위 50을 추출하십시오.
pct sha chem.code items nic act.cost
32360 5ZW Q39 0212000Y0 12421 17811.40 16888.21
28769 5ZW Q39 0209000A0 8741 7834.43 7554.72
4439 5ZW Q39 0103050P0 7733 21566.51 20210.05
...
82763 5D7 Q30 0603020L0 1 1.08 1.13
152673 5D7 Q30 1502010C0 1 0.92 0.85
5149 5D7 Q30 0104020N0 1 0.70 0.68
149501 5D7 Q30 1311060I0 1 0.50 0.49
1000 개가 넘는 항목이 있습니다. 나는 각 항목에 대해 상위 50 개의 항목을 추출하려고합니다. 나는 for
루프를 작성하고 pct 레벨을 반복 할 수 있다는 것을 알고 있지만, 이는 R
이 아닙니다. apply
또는 sapply
을 사용하여 레벨에서 하위 집합을 수행하는 방법을 알아 냈습니다. 행의 하위 집합을 가져 오는 것보다 전체 열을 가져 오는 것이 좋습니다.
링크는 데이터가 아닌 실행 파일입니다. – Arun
[이것을 확인하십시오] (http://stackoverflow.com/questions/14800161/how-to-find-the-top-n-values-by-group-or-within-category-groupwise-in-an-r -dat) :) –
@Arun 실행 파일은 데이터 인 2 개의 csv 파일을 포함하는 '자체 확장 Zip'입니다. NHS에 감사드립니다. – Suz