(나는 대답을 얻은 후에 정말로 멍청한 느낌이 들지만 나는 이것을 알 수 없다.)R에서 data.frame의 특정 하위 집합에 대한 연산을 수행하는 방법은 무엇입니까?
끝에 빈 열이있는 data.frame이 있습니다. 대부분 NAs로 채워지 겠지만 값의 일부 행에 값을 채워야합니다. 이 열은 data.frame의 열 중 하나에서 누락 된 데이터를 추측합니다. 행의 두 MaxPlayers은 "N/A"를 가지고
Game | Rating | MinPlayers | MaxPlayers | MaxPlayersGuess
---------------------------------------------------------
A | 6 | 3 | 6 |
B | 7 | 3 | 7 |
C | 6.5 | 3 | N/A |median(df$MaxPlayers[df$MinPlayers ==3,])
D | 7 | 3 | 6 |
E | 7 | 3 | 5 |
F | 9.5 | 2 | 5 |
G | 6 | 2 | 4 |
H | 7 | 2 | 4 |
I | 6.5 | 2 | N/A |median(df$MaxPlayers[df$MinPlayers ==2,])
J | 7 | 2 | 2 |
K | 7 | 2 | 4 |
주의 사항 :
내 초기 data.frame는 다음과 같이 보인다. 내가하려고하는 것은 내가 MaxPlayers가 무엇인지 추측하기 위해 필요한 정보를 사용하는 것이다. 3 인 게임의 중앙값 (MaxPlayers)이 6 인 경우 MinPlayers == 3 및 MaxPlayers == N/A 인 게임의 경우 MaxPlayerGuess가 6이어야합니다. (필자는 위의 예에서 얻을해야하는지 값 MaxPlayerGuess 코드에 표시하려고했습니다.)
결과 data.frame는 다음과 같이 보일 것이다 :
Game | Rating | MinPlayers | MaxPlayers | MaxPlayersGuess
---------------------------------------------------------
A | 6 | 3 | 6 |
B | 7 | 3 | 7 |
C | 6.5 | 3 | N/A |6
D | 7 | 3 | 6 |
E | 7 | 3 | 5 |
F | 9.5 | 2 | 5 |
G | 6 | 2 | 4 |
H | 7 | 2 | 4 |
I | 6.5 | 2 | N/A |4
J | 7 | 2 | 2 |
K | 7 | 2 | 4 |
한 시도의 결과를 공유하기 :
gld$MaxPlayersGuess <- ifelse(is.na(gld$MaxPlayers), median(gld$MaxPlayers[gld$MinPlayers,]), NA)
Error in gld$MaxPlayers[gld$MinPlayers, ] :
incorrect number of dimensions
사과, 나는 심지어 내가 재현 예제를 제공하는 방법을 모르는 절차를 코딩을 시작하는 방법을 모르기 때문에. – Zelbinian
답변을 시도해 주셔서 감사합니다. 몇 가지 제안 사항을 시험해 봄으로써 문제를 더 잘 파악하고 사례를 게시하는 방법을 파악할 수있었습니다. – Zelbinian
@ Zelbinian, 그래서 일반적으로 griffmer 's를 답변으로 표시합니다. – Chris