크기가 H * W * sizeof (float) 인 단일 malloc 인 장치에 할당 된 메모리가 있습니다.공유 메모리 복사본에 대한 cudaMemcpy2D
이것은 H * W 행렬을 나타내는 것입니다.
행렬의 사분면을 교체해야하는 코드가 있습니다. 이 작업을 수행하기 위해 cudaMemcpy2D를 사용할 수 있습니까? 방금 spitch와 dpitch를 W * sizeof (float)로 지정하고이를 수행하기 위해 매트릭스의 각 사분면에 대한 포인터를 사용해야할까요?
또한 이러한 cudaMemcpy가 메모리 영역이 중복되지 않는다고 말하면 src와 dst가 전혀 겹칠 수 없다는 뜻입니까? 마찬가지로, 내가 한 번 왼쪽으로 옮기고 싶었던 10 바이트 너비의 배열을 가지고 있다면 - 실패 할 것입니다.
감사