난 주변에서 해밍 거리를 얻을 필요가 바이너리 numpy 배열의 1M 가지고, 가장 빠른 방법은 내가 얻을 수있는 가장 빠른 방법은 거리와 함께 플로트 매트릭스를 반환하는 cdist를 사용하고 있습니다.최적화 해밍 거리 파이썬
나는이 같은 시간에 그것을 하나 개의 요소를하고 있어요 그래서 나는 1Mx1M 플로트 행렬을 얻을 메모리가 충분하지 않기 때문에 :
from scipy.spatial Import distance
Hamming_Distance = distance.cdist(array1,all_array,'hamming')
probles 그것을위한 2-3s 같이 촬영하고 있다는 것입니다 각각의 Hamming_Distance를 1m 문서로 만들려면 영원을 필요로했습니다 (그리고 다른 k에 그것을 사용해야합니다).
가장 빠른 방법은 없나요?
멀티 프로세싱을 고려하고 있거나 C로 만들었지 만 파이썬에서 멀티 프로세싱이 어떻게 작동하는지 이해하고 있으며 파이썬 코드와 C 코드를 어떻게 섞어야할지 모르겠다.
당신은 짐바브어 자원에 가깝지 않은 곳에서 당신이 짐마차를 치려고합니다. 한 쌍의 거리를 모두 계산하고 낮은 쌍을 취하는 것보다 가장 가까운 이웃을 찾는 훨씬 더 좋은 방법이 있습니다. – user2357112