2011-02-05 3 views
7

GPS 데이터를 분석 할 때 두 가지 질문이 있습니다.궤적을 비교/클러스터링 (x, y) 점의 GPS 데이터) 및 데이터 마이닝

1) 추출 궤적 나는 기록한 GPS 좌표의 거대한 데이터베이스가 (latitude, longitude, date-time)입니다. 연속적인 레코드의 날짜/시간 값에 따르면, 나는 그 사람이 따르는 모든 궤적/경로를 추출하려고합니다. 예를 들면; M 시간부터 (x,y) 쌍이 시간이 끝날 때까지 계속 변하고 있습니다. N. N 이후에는 (x,y) 쌍의 변화가 줄어들어 그 시점에서 M에서 N까지 걸리는 경로를 궤도라고 부를 수 있다고 결론 내리고 있습니다. 궤적을 추출 할 때 따라야 할 적절한 접근 방법입니까? 제안 할 수있는 잘 알려진 접근법/방법/알고리즘이 있습니까? 효율적인 방식으로 포인트를 유지하도록 제안하고자하는 데이터 구조 나 포맷이 있습니까? 아마도 각 궤도마다 속도와 가속도를 알아내는 것이 유용할까요?

2) 궤적 마이닝 일단 모든 궤도를 따라 가면 경로를 비교하고 클러스터 할 수 있습니까? 시작 지점이나 끝 지점이 비슷한 지 알고 싶으면 중간 경로를 어떻게 비교합니까?

두 경로/경로를 비교하고 유사하거나 유사한 지 어떻게 판단합니까? 더욱이; 유사한 경로를 함께 클러스터링하는 방법은 무엇입니까?

나는이 문제에 관해 연구 나 비슷한 것을 가르쳐 주시면 대단히 감사하겠습니다.

개발은 Python으로 수행되지만 모든 종류의 라이브러리 제안을 환영합니다.

미리 감사드립니다.

+2

체크 아웃 귀하의 태그. 그들 중 누구도 매우 인기가 없습니다. 나는'gps'를'gis'로 바꾸고'python' 태그를 추가하는 것을 고려할 것입니다. –

+0

http://gis.stackexchange.com/에서 질문을 크로스 포스트 할 것을 고려해 볼 수 있습니다. – radek

+1

해당 데이터베이스에 GPS 장치 ID가 있습니까? – yura

답변

9

취리히 대학교 지리학과에서 수행 한 작업을 특히 Patrick LaubeSomayeh Dodge으로 살펴보십시오.

용지

개인 운동 및 지리적 데이터 마이닝에서보세요. 개인 탐색 경로의 클러스터링 강조 핫스팟에 대한 알고리즘을

(link, presentation). GPS 데이터에 대한 DBSCAN 커널 밀도 추정 방법의 사용을 보여줍니다.

또한 노키아의 Mobile Data Challenge 2012 Workshop에서 논문은 특히, 여기에 도움이 될 수 있습니다 :

MobReduce : 이동성의 주 복잡성 감소는 파비안 하트만, 크리스토프 P. 메이어, 잉마르 Baumgart에 의해 (link)

를 추적 및

궤도 클러스터링을위한 탄도 클리닝 프레임 워크 (link)

Agzam Idrissov, Mario A.알버타 대학교 Nascimento

+0

사람들은"시공간의 다른 유형의 움직이는 물체의 궤적 사이의 유사점을 밝히기 위해 방법론 개발에 중점을 둡니다."라는 논문을 통해 정확하게이 분야에서 박사 학위를받는 작업을하고 있습니다. –

1

1) 궤적 추출하기 나는 올바른 방향이라고 생각합니다. gps 데이터에는 잡음이있을 수 있으며 무작위 걸음이 발생하면이를 극복하기 위해 스플라인과 같은 부드러운 작업을 수행해야합니다. 궤적 광업


2) 유사한 궤도에있는 비즈니스 감각이있는가요? (거리 메트릭을 구축하는 데 도움이되며 마호 트 클러스터링 알고리즘을 사용할 수 있습니다.) 1. 일부 사람들이 더 흥미로 웠던 지점을 생각하면 장소 인기도 통계를 생성 할 수 있습니다. 2. 동일한 시작점에 다른 경로를 찾기 위해 경로 유사성이 필요한 경우 첫 번째 시작 끝 위치를 클러스터링 한 다음 커브를 similare (최대 거리 beetween, 적분 거리 - 잘 알려진 기능 메트릭 중 일부)해야합니다.

관련 문제