집계 함수에 대한 다음 소스 코드와 같이 왜 여기에 list function()을 사용해야하는지 이해할 수 없습니다. 대신에 그룹화 할 필요가있는 하나의 열을 사용하여이를 대체하려고합니다. 그리고 저는 왜 'train [Sales! = 0]'과 같은 데이터 세트를 두 번 사용하는지 모르겠습니다. 두 번째 데이터 집합 매개 변수로 다른 데이터 집합을 사용하면 어떻게됩니까? 나는 그것이 가능한 높은 실수가 될 수있는 변화를 가져올 것이라고 생각한다.집계 함수가 직관적이지 않습니다
aggregate(train[Sales != 0]$Sales,
by = list(train[Sales != 0]$Store), mean)
아마도 이것이 잘못된 사용 사례라고 말할 수 있습니다. 그러나 나는 R Documentation에서이 소스 코드를 보았다.
## Compute the averages for the variables in 'state.x77', grouped
## according to the region (Northeast, South, North Central, West) that
## each state belongs to.
aggregate(state.x77, list(Region = state.region), mean)
내 질문을 읽어 주셔서 감사합니다.
코드가 잘못되었을 수 있습니다. 'train '이 행렬 또는 data.frame 인 경우이 명령'train [Sales! = 0]'은 이미 오류를 표시합니다 ('undefined columns selected'). 그럼에도 불구하고'list()'함수를 피하기 위해'aggregate (Sales ~ Store, data = train [Sales! = 0,], mean)'할 수 있습니다. 'state.x77'은 이미 첨부 된 데이터 세트이므로, 예제 에서처럼 사용할 수 있습니다. – Jimbou