저는 apache spark와 scala를 처음 사용하고 예제를 통해 그것을 배우려고합니다. 나는 시내 버스 위치 (행 번호, 시간, 경도, latitute)의 간단한 세트있어 : 몇 가지 변환 후RDD에서 가장 가까운 기록을 찾는 방법
9, 23/09/16 10:20, 123.3, 123.3
9, 23/09/16 10:21, 125.3, 125.3
을 나는 개체의 RDD를 얻을 :
,571,996 :class BusPosition(val line: String, val time: DateTime, val position: Point)
다음으로 내가 좋아하는, 프레임의 RDD
을 갖고 싶어3210
각 프레임은 가장 가까운 두 개의 시간 기록을 결합합니다. 누구든지 그런 세트를 만들고 가장 가까운 이웃을 찾는 법을 알고 있습니까? 검색했지만 적절한 답변을 찾을 수 없습니다.
일부 옵션 : a) 파티션 재 분류, 파티션 분류 및 선형 스캔 수행, b) 래그/리드와 함께 창 기능 사용. – zero323
고맙지 만 완전히 얻지는 못했습니다. 간단한 코드 예제를 알려주시겠습니까? – Hejwo