나는 가구 목록과 그들이 새로운 우편 번호로 옮긴 날짜가 있습니다. 작은 부분은 다음과 같습니다 :열을 통한 R 관측
ADD0 <- as.Date(c("2008-07-01", "1998-07-01", "2001-11-01", "1997-08-01"), format="%Y-%m-%d")
ADD1 <- as.Date(c(NA, "2001-09-01", "2002-03-01", NA), format="%Y-%m-%d")
ADD2 <- as.Date(c(NA, "1992-09-01", "2001-09-01", "2007-12-01"), format="%Y-%m-%d")
ZIP0 <- as.character(c(30126, 30345, 30068, 30253))
ZIP1 <- as.character(c(NA, 30263, 31064, NA))
ZIP2 <- as.character(c(NA, 30345, 30067,30062))
DF <- data.frame(ADD0, ZIP0, ADD1, ZIP1, ADD2, ZIP2)
> DF
ADD0 ZIP0 ADD1 ZIP1 ADD2 ZIP2
1 2008-07-01 30126 <NA> <NA> <NA> <NA>
2 1998-07-01 30345 2001-09-01 30263 1992-09-01 30345
3 2001-11-01 30068 2002-03-01 31064 2001-09-01 30067
4 1997-08-01 30253 <NA> <NA> 2007-12-01 30062
그래서 집 2는 1998 년 7 월, 2001 년 9 월 및 92 년 9 월에 이동했습니다. 보시다시피 내 문제는 날짜가 반드시 올바른 순서가 아니며 내가 있어야한다는 것입니다. 이 작업을 수행하는 유일한 방법은 데이터 집합을 반복하고 내 자신의 정렬 알고리즘을 작성하는 것입니다. 450k 관측이 있기 때문에 효율도 중요합니다.
이전에 이런 종류의 작업을 한 사람이 있습니까? 어떤 팁? 내가 찾지 못한 깨끗한 해결책이 있습니까?
** 데이터를 올바른 순서로 한 번 정렬 ** 처리하는 ** 문제는 무엇입니까? 어쨌든 한 번 이상 반복해야합니다. 정렬은 가능한 한 저렴합니다. 당신은 자신의 정렬 알고리즘을 발명 할 필요가 없습니다! –
나는 네가 무슨 뜻인지 정확히 모르겠다. 데이터를 사전 처리하는 방법을 묻습니다. 나는 그것을 단순 정렬 작업으로 보지 않는다. 왜냐하면 그것은 일반적으로 벡터 정렬과 관련되기 때문이다. 나는 내가 받아 들였던 대답이 정확하게 내가 얻고 싶어하는 해결책을 제공한다고 믿는다. 대안이 있습니까? – gregmacfarlane