2010-12-06 10 views
0
의 선택을 바탕으로/의사 결정

나는이 같은 유사 중복 행의 수를 가지고 data.frame,이 : 이제우선 순위 행

con <- textConnection(Lines <- " 
First, Last, Address, Address 2, Email, Custom1, Custom2, Custom3 
A, B, C, D, [email protected],1,2,3 
A, B, C, D, [email protected],1,2,2 
A, B, C, D, [email protected],1,2,1 
") 
x <- read.csv(con) 
close(con) 

을 때 드 중복, 다음과 같은 방법으로 :

x <- x[!duplicated(x[,c("email")]),] 

Custom3 = 1을 포함하는 행의 우선 순위를 지정하는 방법을 권장 할 수 있습니까? 또는 중복 제거를위한 더 나은 메커니즘이 있습니까?

답변

1

은 발견 중복 전에 정렬하십시오 :

X < - X [주문 (X [C ("Custom3을")])]
X < - X [중복 (X를 [, C를 ("! 이메일 ")])])]

+0

좋은 제안, 나는 정렬 순서가 하나의 요소라고 생각하지는 못했지만 확실히 이해가됩니다. –

+0

Custom3 == 2의 우선 순위를 말하고 싶다면 내 제안이 효과가 없을 수도 있지만,이 경우에는 코드 길잡이가 하나의 라이너보다 우수 할 것입니다. 그래서 제 솔루션은 그렇게 보편적이지는 않지만 귀하의 질의에만 국한된 것입니다. –