다음과 같은 표가 있습니다. 각 클러스터 (열 1)에는 시작 (열 2) 및 끝 (열 3) 좌표가있는 작은 영역의 여러 요소 (열 4)의 주석이 포함되어 있습니다. 각 항목에 대해 해당 클러스터의 가장 가까운 다른 요소까지의 거리에 해당하는 열을 추가하고 싶습니다. 그러나 클러스터의 한 쌍 요소가 동일한 시작/끝 좌표 또는 겹치는 영역을 갖는 경우를 제외하고 싶습니다. 그러한 데이터 프레임에 대해 어떻게 여분의 nearest_distance
열을 생성 할 수 있습니까?가장 가까운 비 중첩 요소까지의 거리를 찾는 방법은 무엇입니까?
cluster-47593-walk-0125 252 306 AR
cluster-47593-walk-0125 6 23 ZNF148
cluster-47593-walk-0125 357 381 CEBPA
cluster-47593-walk-0125 263 276 CEBPB
cluster-47593-walk-0125 246 324 NR3C1
cluster-47593-walk-0125 139 170 HMGA1
cluster-47593-walk-0125 139 170 HMGA2
cluster-47593-walk-0125 207 227 IRF8
cluster-47593-walk-0125 207 227 IRF1
cluster-47593-walk-0125 207 245 IRF2
cluster-47593-walk-0125 207 227 IRF3
cluster-47593-walk-0125 207 227 IRF4
cluster-47593-walk-0125 207 227 IRF5
cluster-47593-walk-0125 207 227 IRF6
cluster-47593-walk-0125 204 245 IRF7
cluster-47593-walk-0125 13 36 PATZ1
cluster-47593-walk-0125 14 143 PAX4
cluster-47593-walk-0125 4 25 RREB1
cluster-47593-walk-0125 73 87 SMAD1
cluster-47593-walk-0125 73 87 SMAD2
cluster-47593-walk-0125 73 87 SMAD3
cluster-47593-walk-0125 71 89 SMAD4
cluster-47593-walk-0125 11 40 SP1
cluster-47593-walk-0125 11 38 SP2
cluster-47593-walk-0125 7 38 SP3
cluster-47593-walk-0125 11 38 SP4
cluster-47593-walk-0125 13 33 GTF2I
cluster-47593-walk-0125 281 352 YY1
cluster-47586-walk-0222 252 306 AR
cluster-47586-walk-0222 6 23 ZNF148
[...]
당신이 2 열을 보장 할 수있는 경우 <= 3 열은 항상 다음 적어도 당신이 기준'최대 (데이터를 [충족 항목을 검사에 문제를 줄일 수 있습니다, 3 10 개 000 클러스터가 ]) data [i, 3]))'이다. –