각 분기에 대해 가장 빠르게 성장하는 5 가지 항목을 파악하려고합니다. 나는 3 열 - 분기 수 (df $ QNum), 주제 (df $ Topic) 및 그 분기의 레코드 수 (df $ Total_Hits)와 함께 R에서 데이터 프레임 (df라고 부름)을 갖습니다.R : 데이터 프레임에 여러 변수가있는 "성장"열을 계산하는 방법
Total_Hits Topic QNum
10 Technology 1
86 Video Conferencing 1
14 Video Conferencing 2
10 Technology 3
1 Video Conferencing 1
12 Technology 21
나는 안양에 새 열을 만들려면, DF $ QonQGrowth는 각 레코드에 대해, 오버 그 주제에 조회수의 성장을 계산하는 것이 : 여기
내 dataframe 안양 보이는 방법의 예 전 분기. df $ QNum = 1을 찾는 방법은 마음에 들지 않지만이 예제의 세 번째 레코드는 다음과 같이 계산됩니다. (Total_Hits/(Total_Hits, 여기서 Topic = "화상 회의"및 QNum = 1) -1)나는 그것이 같을 것이라고 생각 다음하지만 확실히 그것을 알아낼 수 없습니다
df$QonQGrowth <- (df$Total_Hits/([a lookup of Total_Hits for df$Topic and (df$Qnum-1)?]))-1
데이터 세트가 모든 항목을 매 분기에 대한 레코드가되지 않을 수 그래서 꽤 크다 .
비슷한 질문 here과 here하지만 그들은 내가 원하는 것을 정확하게 수행하지 않습니다.
편집 : This question ddply 또는 aggregate를 사용하면 유용 할 수도 있습니다.
미리 감사드립니다.
어쩌면 복잡하지만, 모든 추한하지 :-). –
정확히 내가 원했던 것, 감사합니다. 불행하게도 너무 커서 제 데이터 세트에서 작동하지 않습니다. (그러나 ddply를 사용할 수있는 방법을 확인하는 것이 좋습니다.) – jegeragh
오류 메시지가 표시됩니다. 여러 개의 코어와 충분한 메모리가 있지만 data.table 솔루션이 더 좋은 옵션 일 수 있다면 쉽게 병렬로 모든 ddply를 실행할 수 있습니다. – David