사용자가 보유한 사진 세션 수 (같은 시간에 촬영 된 사진 그룹)를 계산하려고합니다. 이 예에서는 해당 사용자가 이전 사진보다 1000 초 이내에 찍은 사진이 세션의 일부라고합니다.상대 작업 시간을 기준으로 사용자 작업을 여러 세션으로 그룹화
원래는 한 장의 사진을 찍은 다음 그 시간을 위의 행과 비교하면서 사진을 주문할 계획 이었지만 하이브에서 가장 좋은 방법은 확실치 않습니다.
이게 가능합니까, 아니면 python과 같은 다른 언어로 이것을하는 것이 더 좋을까요?
table of data:
uid | pid | time_in_sec
001 | 111 | 1000
001 | 222 | 1250
001 | 333 | 2200
001 | 444 | 5000
002 | 555 | 2000
002 | 666 | 2500
결과 : 당신이 나머지를 할 수 있도록 세션 정보 테이블을 만들 수
uid | num_sessions
001 | 2
002 | 1