테이블 daily_user
의 샘플 데이터가 있습니다. 각 행은 특정 날짜의 활성 사용자를 나타내며 수익은 해당 날짜에 사용자가 생성 한 금액을 기반으로합니다. 이 표의 가장 빠른 날짜는 1/1입니다.하이브의 누적 고유 카운트
date user_id group revenue
1/1 1 a 1
1/1 2 b 0
1/1 3 a 0
1/2 2 b 10
1/2 3 a 0
1/3 3 a 1
나는 기본적으로 각 행. 1/1에서 지금까지 지불 한 얼마나 많은 사용자가 각각의 관찰 일에, 각 그룹에 대해 알려줍니다 예를 들어, 마지막 행에서 의미 (원하는 출력 1/1 1/3, 그룹 B의 총에서 우리는 우리를 지불 한 사용자)이 있습니다
end_date group # users who ever paid
1/1 a 1
1/1 b 0
1/2 a 1
1/2 b 1
1/3 a 2
1/3 b 1
누적 합계를 할 수있는 몇 가지 UDF에있는 것 같다,하지만 난 어떤 누적 고유 한 카운트 기능이 있는지 확실하지 않다 내가 여기서 활용할 수있는 것. 어쨌든 이것을 구현하기 위해 하이브 쿼리를 구조화 할 수 있습니까?
누적 * 별개 * 수 또는 누적 할인 수를 의미합니까? –
뚜렷한 의미, 감사합니다! – tonystarkix