2013-06-11 3 views
-1

R에 두 개의 데이터 열 (예 : idmaster_id)이 있습니다. id의 모든 값이 master_id에 있어야합니다. 그러나 나는 그것이 사실이 아니라고 생각하며, 어떤 것이 잘못된 값인지를 확인하고자합니다. 나는 100k의 주문 데이터를 다루고 있기 때문에 데이터를 검사 할 수 없다.R의 다른 열의 값을 기반으로 한 열의 잘못된 값을 찾는 방법?

오류 값을 찾는 방법은 무엇입니까?

+0

두 개의 열에서 다른 값을 찾고 있다면'setdiff (id, master_id)'를 사용할 수 있습니다. . 'master_id'에없는'id'의 값을 반환합니다 – DrDom

+1

이것은 [상위 R 개의 질문 중 하나]와 중복되는 것으로 보입니다 (http://stackoverflow.com/questions/1299871/how-to-join -data-frames-in-r-inner-outer-left-right/1300618 # 1300618). 또한보십시오 :? 합병 –

+0

왜 downvote? – vad

답변

1

% % 기능이 유용 할 수 있습니다. 첫 번째가 아니고 두 번째가 아닌 경우에 거짓이됩니다.

예.

DF$master_id %in% DF$id 

ID는 (R 도움말 파일에서) 실행을 어떻게 작동하는지 그래서 상대가없는 master_id 값을보고, 거짓

을 얻거나 것, master_id의 하위 집합입니다

1:10 %in% c(1,3,5,9) 
0

Here's an answer 에서 2 일 전 :

library(data.table) 
DF1<-data.frame(x=1:3,y=4:6,t=10:12) 
DF2<-data.frame(x=3:5,y=6:8,s=1:3) 
library(data.table) 
DF1 <- data.table(DF1, key = c("x", "y")) 
DF2 <- data.table(DF2, key = c("x", "y")) 
DF1[!DF2] # maybe you want this? 
DF2[!DF1] # or maybe you want this? 
관련 문제