2 개의 데이터 프레임을 고려하고 2 개의 고유 한 열 (idA, idB)로 2 개의 데이터 프레임을 결합하고 col 거리의 합계를 계산해야합니다. . 그 거리가 가산되어야하므로 방법 (IDA, IDB)에 의해, (IDB, IDA)로 동일한 산출이 방법이어야 여러 열에 2 개의 데이터 프레임 결합하기 Pandas
In [1]: df1 = pd.DataFrame({'idA': ['1', '2', '3', '2'],
...: 'idB': ['1', '4', '8', '1'],
...: 'Distance': ['0.727273', '0.827273', '0.127273', '0.927273']},
...: index=[0, 1, 2, 3])
...:
In [2]: df2 = pd.DataFrame({'idA': ['1', '5', '2', '5'],
...: 'idB': ['2', '1', '4', '7'],
...: 'Distance': ['0.11', '0.1', '3.0', '0.8']},
...: index=[4, 5, 6, 7])
:
Sum_Distance idA idB
0 0.727273 1 1
1 3.827273 2 4 <-- 2,4 = 3.0 + 2,4 = 0.827273
2 0.127273 3 8
3 1.037273 2 1 <-- 2,1 = 0.927273 + 1,2 = 0.11
4 0.1 5 1
5 0.8 5 7
도움 방법을 찾을 Pandas/Spark를 사용하여 그것을하는 방법.
, 당신은 먼저 각 데이터 프레임을 정렬 할 수 있습니다 업데이트되었습니다. – Tai