나는 N ×의 N 두 차원 배열을 가지고, 내가 할 그것의 매 분기 평균하려면 다음과 같이 같은 번호 :평균 분기
matrix = [ 1 2 4 6
6 7 1 1
9 8 3 6
4 7 9 2 ]
및 적용 CUDA 후 커널을 사용하면 결과는 다음과 같습니다 :
result = [ 4 4 3 3
4 4 3 3
7 7 5 5
7 7 5 5 ]
어떻게 C CUDA 커널로 구현할 수 있습니까?
관심있는 문제 크기는 무엇입니까? – talonmies
하나의 매우 큰 매트릭스 또는 더 작은 매트릭스에서이 조작을 수행합니까? – hexist
문제 크기는 크기가 [4000 × 4000] 인 약 하나의 매트릭스입니다. –