NumPy와 다차원 색인 및 대각선 대칭

size = 10 row_idx, col_idx = np.tril_indices(size) zip_idx = zip(row_idx, col_idx) print len(zip_idx), zip_idx[:5] >>> 55 [(0, 0), (1, 0), (1, 1), (2, 0), (2, 1)] all_idx = [(r0, c0, r1, c1) for (r0, c0) in zip_idx for (r1, c1) in zip_idx] print len(all_idx), all_idx[:5] >>> 3025 [(0, 0, 0, 0), (0, 0, 1, 0), (0, 0, 1, 1), (0, 0, 2, 0), (0, 0, 2, 1)] a, b, c, d = zip(*all_idx) tril_part = np.transpose(s.power, (0, 3, 4, 1, 2, 5, 6))[:,:,:, a, b, c, d] print tril_part.shape >>> (3, 19, 75, 3025)

올바른 경로에 있습니다. np.tril_indices을 사용하면 이러한 하위 삼각형을 실제로 멋지게 색인 할 수 있습니다. 개선해야 할 부분은 데이터의 실제 인덱싱/슬라이싱입니다.

이 (복사 및 pasteable)를 시도하십시오 :

는

import numpy as np 
shape = (3, 10, 10, 19, 75, 10, 10) 
p = np.arange(np.prod(shape)).reshape(shape) # this is not symmetric, but not important 

ix, iy = np.tril_indices(10) 
# In order to index properly, we need to add axes. This can be done by hand or with this 
ix1, ix2 = np.ix_(ix, ix) 
iy1, iy2 = np.ix_(iy, iy) 

p_ltriag = p[:, ix1, iy1, :, :, ix2, iy2] 
print p_ltriag.shape # yields (55, 55, 3, 19, 75), axis order can be changed if needed 

q = np.zeros_like(p) 
q[:, ix1, iy1, :, :, ix2, iy2] = p_ltriag # fills the lower triangles on both sides 
q[:, ix1, iy1, :, :, iy2, ix2] = p_ltriag # fills the lower on left, upper on right 
q[:, iy1, ix1, :, :, ix2, iy2] = p_ltriag # fills the upper on left, lower on right 
q[:, iy1, ix1, :, :, iy2, ix2] = p_ltriag # fills the upper triangles on both sides

배열 q 이제 (위쪽 삼각형이 아래 삼각형의 내용으로 대체되었다) p의 대칭 된 버전이 포함되어 있습니다. 마지막 행은 역순으로 iy 및 ix 색인을 포함하며, 본질적으로 하위 삼각 행렬의 전치를 작성합니다. 낮은 삼각형, 우리가 배열이 현실적으로 그렇게 큰되지 않습니다 0

ux, uy = np.triu_indices(10) 
p[:, ux, uy] = 0 
q[:, ux, uy] = 0 
p[:, :, :, :, :, ux, uy] = 0 
q[:, :, :, :, :, ux, uy] = 0 

print ((p - q) ** 2).sum() # euclidean distance is 0, so p and q are equal 

print ((p ** 2).sum(), (q ** 2).sum()) # prove that not all entries are 0 ;) - This has a negative result due to an overflow

출처

2014-05-15 19:17:52 eickenberg

나중에 다시 압축해야하는 경우이 압축을 수행하는 것이 합리적인지 여부는 확실하지 않습니다. – eickenberg

np.ix_ 확실히가는 길 같습니다. 내 도구 상자에 추가. 그러나 원래 (p)와 결과 (q)에서 np.allclose를 수행하면 False가됩니다. 또한 인덱스 1과 2를 사용하는 이유와 ix와 iy를 재사용하지 않는 이유를 왜 이해하지 못합니까? 가독성? 4 개의 인덱스가 아닌 2 개의 인덱스 만 사용하면 충분합니까? 예 : 55 * 55 조합 모두?나는 후자의 접근 방식을 가지고 놀았지만, '차원 높은 색인'ValueError를 너무 많이 가져 왔습니다. –

'np.ix_'는 참으로 유용한 명령입니다. 'p'와'q'는 아래 삼각형의 반쪽에서만 일치하고'q'는'p'의 대칭 버전입니다 (''p''를 생성하는 코드에서 내 주석을보십시오. 대칭). 가독성과 일반화를 위해'ix1'과'ix2'를 만들었습니다. 귀하의 경우에는'ix1'에는'ix [:, np.newaxis]','ix2'에는'ix [np.newaxis, :]'라고 쓸 수 있습니다. 다른 축을 추가하는 것은 매우 중요합니다.이 방법은 numpy가 인덱스의 데카르트 곱을 생성하므로 매우 중요합니다. 출력 배열의 치수를 확인하십시오 (크기 55의 축이 두 개 있음). – eickenberg

NumPy와 다차원 색인 및 대각선 대칭

답변

관련 문제