나는이 문제로 내 바퀴를 돌고 있었고 누군가가 그것에 접근하는 최선의 방법에 대한 통찰력이 있는지 궁금해하고있었습니다. 하나의 datetime64 [ns]를 포함하여 여러 개의 열이있는 팬더 DataFrame이 있습니다. 서로 아주 가까운 datetime을 가진 레코드를 그룹화하는 방법을 찾고 싶습니다. 예를 들어, 나는 그룹화 된 ID라는 공통의 ID를 할당하여 서로의 2 초 내에 발생하는 경우 함께 다음 트랜잭션을 그룹화에 관심이있을 수 있습니다 내가 찾고 있지 않다파이썬에서 가까운 DateTimes를 사용하여 레코드 그룹화 pandas DataFrame
Transaction ID Time Grouped ID
1 08:10:02 1
2 08:10:03 1
3 08:10:50
4 08:10:55
5 08:11:00 2
6 08:11:01 2
7 08:11:02 2
8 08:11:03 3
9 08:11:04 3
10 08:15:00
참고 시간 창을 확장해야합니다 빠른 간격으로 트랜잭션이 계속 발생하면 광고는 무한합니다. 전체 2 초 창이 지나면 새 창은 다음 트랜잭션으로 시작됩니다 (트랜잭션 5 - 9에 표시된 것처럼). 또한이 분석은 궁극적으로 밀리 초 수준 (즉, 50 밀리 초 이내에 트랜잭션 결합)에서 수행되지만 위에 제시하기 쉽도록 초 단위로 고정됩니다.
당신이 제공 할 수있는 통찰력을 위해 대단히 감사합니다!