R에 두 개의 데이터 열 (예 : id
및 master_id
)이 있습니다. id
의 모든 값이 master_id
에 있어야합니다. 그러나 나는 그것이 사실이 아니라고 생각하며, 어떤 것이 잘못된 값인지를 확인하고자합니다. 나는 100k의 주문 데이터를 다루고 있기 때문에 데이터를 검사 할 수 없다.R의 다른 열의 값을 기반으로 한 열의 잘못된 값을 찾는 방법?
오류 값을 찾는 방법은 무엇입니까?
R에 두 개의 데이터 열 (예 : id
및 master_id
)이 있습니다. id
의 모든 값이 master_id
에 있어야합니다. 그러나 나는 그것이 사실이 아니라고 생각하며, 어떤 것이 잘못된 값인지를 확인하고자합니다. 나는 100k의 주문 데이터를 다루고 있기 때문에 데이터를 검사 할 수 없다.R의 다른 열의 값을 기반으로 한 열의 잘못된 값을 찾는 방법?
오류 값을 찾는 방법은 무엇입니까?
% % 기능이 유용 할 수 있습니다. 첫 번째가 아니고 두 번째가 아닌 경우에 거짓이됩니다.
예.
DF$master_id %in% DF$id
ID는 (R 도움말 파일에서) 실행을 어떻게 작동하는지 그래서 상대가없는 master_id 값을보고, 거짓
을 얻거나 것, master_id의 하위 집합입니다
1:10 %in% c(1,3,5,9)
Here's an answer 에서 2 일 전 :
library(data.table)
DF1<-data.frame(x=1:3,y=4:6,t=10:12)
DF2<-data.frame(x=3:5,y=6:8,s=1:3)
library(data.table)
DF1 <- data.table(DF1, key = c("x", "y"))
DF2 <- data.table(DF2, key = c("x", "y"))
DF1[!DF2] # maybe you want this?
DF2[!DF1] # or maybe you want this?
두 개의 열에서 다른 값을 찾고 있다면'setdiff (id, master_id)'를 사용할 수 있습니다. . 'master_id'에없는'id'의 값을 반환합니다 – DrDom
이것은 [상위 R 개의 질문 중 하나]와 중복되는 것으로 보입니다 (http://stackoverflow.com/questions/1299871/how-to-join -data-frames-in-r-inner-outer-left-right/1300618 # 1300618). 또한보십시오 :? 합병 –
왜 downvote? – vad