2017-10-13 1 views
0

아마도이 문제가 제기되어 다른 곳으로 전달되었지만 찾지 못했습니다. 각 슬라이스는 또한 a 유효하도록numpy 배열을 사용하여 배열의 인덱스를 분할하는 방법은 무엇입니까?

a = np.arange(100).reshape(10,10) 
b = np.zeros(a.shape) 
start = np.array([1,4,7]) # can be arbitrary but valid values 
end = np.array([3,6,9])  # can be arbitrary but valid values 

startend 모두 유효한 값이 우리가 NumPy와 배열을 가정 .

b[:, start:end] = a[:, start:end] #error 

이 구문이 작동하지 않지만, 동등의 : 나는 b에서의 해당 지점에 a에서 하위 어레이의 값을 복사 싶어 더 나은가 궁금

b[:, start[0]:end[0]] = a[:, start[0]:end[0]] 
b[:, start[1]:end[1]] = a[:, start[1]:end[1]] 
b[:, start[2]:end[2]] = a[:, start[2]:end[2]] 

이 방법은 startend 배열을 통해 명시적인 for 루프 대신 사용됩니다.

감사합니다.

+0

시작과 끝의 쌍은 항상 일정한 차이가 있습니까 (여기서 2)? – Divakar

+0

은 반드시 그런 것은 아니지만 인덱스는 유효한 것으로 가정 할 수 있습니다. – galactica

답변

1

우리는 start에 대한 비교의 두 세트와 end 배열을 편집 할 장소의 마스크를 만들 수 broadcasting를 사용하고 단순히 벡터화 된 솔루션을 boolean-indexing으로 할당 할 수 있습니다 -

# Range array for the length of columns 
r = np.arange(b.shape[1]) 

# Broadcasting magic to give us the mask of places 
mask = (start[:,None] <= r) & (end[:,None] >= r) 

# Boolean-index to select and assign 
b[:len(mask)][mask] = a[:len(mask)][mask] 

샘플 실행 -

In [222]: a = np.arange(50).reshape(5,10) 
    ...: b = np.zeros(a.shape,dtype=int) 
    ...: start = np.array([1,4,7]) 
    ...: end = np.array([5,6,9]) # different from sample for variety 
    ...: 

# Mask of places to be edited 
In [223]: mask = (start[:,None] <= r) & (end[:,None] >= r) 

In [225]: print mask 
[[False True True True True True False False False False] 
[False False False False True True True False False False] 
[False False False False False False False True True True]] 

In [226]: b[:len(mask)][mask] = a[:len(mask)][mask] 

In [227]: a 
Out[227]: 
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9], 
     [10, 11, 12, 13, 14, 15, 16, 17, 18, 19], 
     [20, 21, 22, 23, 24, 25, 26, 27, 28, 29], 
     [30, 31, 32, 33, 34, 35, 36, 37, 38, 39], 
     [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]]) 

In [228]: b 
Out[228]: 
array([[ 0, 1, 2, 3, 4, 5, 0, 0, 0, 0], 
     [ 0, 0, 0, 0, 14, 15, 16, 0, 0, 0], 
     [ 0, 0, 0, 0, 0, 0, 0, 27, 28, 29], 
     [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 
     [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]) 
+0

감사합니다! 이 마스크 트릭은 깔끔하게 보입니다! 하지만 효율성 문제가 발생합니까? 예 :이 예에서 전체 ndarray의 복사본 만들기? 실용적인 시나리오에서는 꽤 큰 ndarray가 있습니다. 예를 들어, a.shape = (128, 32x32x32)와 같은 값 할당은 각 반복마다 다른 시작/끝 값에 따라 여러 번 반복됩니다. – galactica

+0

@galactica 참조? 어느 단계를 언급하고 있습니까? – Divakar

+0

@galactica 'a [: len (mask)] [mask]'에서 사본을 말하는 경우, 마스킹으로 피할 수 없으며 모든 것을 벡터화 된 방식으로 조각 낼 수 없습니다. 그래서, 메모리 효율이 걱정된다면, 나는 루프를 유지하고 다음과 같이 사용할 것이라고 생각한다 :'b [0, start [0] : end [0]] = a [0, start [0] : end [0]]' 등등. – Divakar

관련 문제