2014-05-21 2 views
0

여러 번 작성된 문서가 있습니다. 나는 에 일시적으로 클러스터를 만들고 싶습니다.시간에 문서를 클러스터링합니다.

문서를 관련 타임 스탬프가있는 문서 그룹으로 묶고 싶습니다. 예를 들어, 시간 X에 생성 된 문서의 수가 "스파이크"인 경우 동일한 클러스터로 그룹화됩니다.

수있는 클러스터가 몇 개인 지 가정합니다.

+2

구글 "버스트 탐지", "스파이크 탐지", "피크 검출"을. 당신이 문서를보고 있다는 사실은 거의 중요하지 않으며 단지 포인트 이벤트로보아야합니다. –

답변

1

클러스터가 얼마나 많은지 알지 못하는 경우 신생 가스가 성장하기에 좋은 알고리즘입니다. 여기에서 데모를 가지고 놀 수 있습니다 : http://www.demogng.de/

당신의 작업에는 1D 케이스가 필요합니다.

현재 구현 중 하나를 찾을 수 있습니다 https://github.com/BelBES/libGNG

관련 문제