2016-07-25 4 views
-1

저는 athletes.df라는 데이터 프레임과 medals.df라는 데이터 프레임이 있습니다. 둘 다 고유 키인 athlete_id라는 열을 가지고 있습니다. 내가 가진 문제는 입니다. 일부 행은 medals.df 테이블에 표시되지만 athletes.df에는 표시되지 않습니다.이 경우 medals.df에서 제거해야합니다. 데이터의R - 다른 데이터 프레임의 열에 따라 데이터 프레임에서 행을 제거합니다.

예 : medals.df에서 마지막 행을 보면이이 경우에, athletes.df에 나타나지 않습니다 'ERR'의 athlete_id있다

athletes.df 
    athlete_id V1 V2 
    'ttt'  5 6 
    '45d'  4 5 
    'tjd   4 5 

medals.df 
    athlete_id V3 V4 
    'ttt'  2 4 
    '45d'  5 5 
    'tjd   4 5 
    'err'  6 7 

나는 것 전체 행을 제거하고 싶습니다 .Basicaly athelees_id가 ateletes.df 테이블에서 발견되지 않으면 medals.df에서 행을 제거하려고합니다. 루프를 사용하여이 작업을 수행 할 수 있지만 실제 데이터는 각 데이터 세트에 대해 약 30000 개의 행이며 이는 매우 오랜 시간이 걸릴 수 있습니다. 효율적인 방법으로 수행 할 수있는 방법입니까?

또한
athletes.df <- athletes.df[athletes.df$athlete_id %in% medals.df$athlete_id, ] 
+1

: http://stackoverflow.com/questions/33070523/how-to-subset-a-data-frame-based-on- – dayne

답변

0

당신이 찾고있는 명령어입니다 베이스 프레임 내의 다른 데이터 프레임
관련 문제