3 개의 열이있는 테이블이 있다고 가정합니다. user, time, place
. 각 사용자에 대한 전환 시간이 특정 임계 값 이하인 경우 place
전환 그래프를 만들고 싶습니다. 즉 사용자에 의해 그룹화하고 시간 순서에 따라 연속적인 행 (i, j)으로부터 에지 place_i 내지 place_j의 유향 그래프를 생성하고, (place_i, place_j)의 각 인스턴스에 대한 에지의 가중치를 증가시킨다. 소스 테이블의 행은 특별한 순서가 아닙니다. 이것이 파이썬 API로 가능합니까? 그렇지 않다면 스칼라에서 어떻게 할 수 있습니까?시계열 테이블에서 스파크 그래프 만들기
샘플 테이블 : 우리는 시간 임계 값 제한을 무시하면
user,time,place
joe,1,A
jack,1,B
joe,2,B
jack,3,C
joe,4,D
jane,5,A
jane,1,B
이 그래프는, {(A, B), (B에서 4 개 정점 (A, B, C, D)와 가장자리가 있어야 C), (B, D), (B, A)}.