2015-01-27 3 views
1

R에서는 다음 명령문을 사용하여 ds $ Name에 의해 X의 최소값을 포함하는 데이터 프레임을 만듭니다.누락 된 값이있는 R 언어 tapply

MinX <- as.data.frame(tapply(ds$X, ds$Name, min)) 

는 데이터 세트 같은 고려 :

ds$Name  ds$X 
Bob   10 
Bob   9 
Mary   14 
Mary   7 
Bob   NA 

DS를 $ 이름이 같은 값 포함 (예를 들면, 밥, 마리아) DS의 $ 이름을 여러 번 (예를 들어, 여러 행 곳 DS가있다 $ Name은 Bob이고 ds $ Name은 Mary입니다.) 다른 여러 행이 있습니다. 따라서 Bob 레코드의 최소 ds $ X와 Mary 레코드의 최소 ds $ X를 원합니다. ds $ Name에는 누락 된 데이터가 없습니다. 위의 예제 데이터에서 Bob의 최소 X는 9이고 Mary의 최소 X는 7입니다.

변수 ds $ X는 정수이며 ds $ X에 누락 된 데이터가 있습니다. 누락 된 값을 무시하면서 ds $ Name에 의해 ds $ X의 최소값을 찾습니다.

사실 현재 ds $ X의 최소값이 누락되지 않은 정수인 경우 일부 ds $ X에 대한 결과가 누락됩니다 (즉, NA).

미리 감사드립니다.

답변

3

다른 요약 기능과 마찬가지로 min()에는 na.rm= 매개 변수가 있으며 NA 값을 제거하려면 TRUE로 설정할 수 있습니다. 자세한 내용은 ?min 도움말 페이지를 참조하십시오. 대신, 할

MinX <- as.data.frame(tapply(ds$X, ds$Name, min, na.rm=T)) 
+0

씨 Flick, 그 일했다. 고마워요! – user2502904

관련 문제