저는 athletes.df라는 데이터 프레임과 medals.df라는 데이터 프레임이 있습니다. 둘 다 고유 키인 athlete_id라는 열을 가지고 있습니다. 내가 가진 문제는 입니다. 일부 행은 medals.df 테이블에 표시되지만 athletes.df에는 표시되지 않습니다.이 경우 medals.df에서 제거해야합니다. 데이터의R - 다른 데이터 프레임의 열에 따라 데이터 프레임에서 행을 제거합니다.
예 : medals.df에서 마지막 행을 보면이이 경우에, athletes.df에 나타나지 않습니다 'ERR'의 athlete_id있다
athletes.df
athlete_id V1 V2
'ttt' 5 6
'45d' 4 5
'tjd 4 5
medals.df
athlete_id V3 V4
'ttt' 2 4
'45d' 5 5
'tjd 4 5
'err' 6 7
나는 것 전체 행을 제거하고 싶습니다 .Basicaly athelees_id가 ateletes.df 테이블에서 발견되지 않으면 medals.df에서 행을 제거하려고합니다. 루프를 사용하여이 작업을 수행 할 수 있지만 실제 데이터는 각 데이터 세트에 대해 약 30000 개의 행이며 이는 매우 오랜 시간이 걸릴 수 있습니다. 효율적인 방법으로 수행 할 수있는 방법입니까?
또한athletes.df <- athletes.df[athletes.df$athlete_id %in% medals.df$athlete_id, ]
: http://stackoverflow.com/questions/33070523/how-to-subset-a-data-frame-based-on- – dayne