0
나는 문제의 코드를 찾고 있어요 : How do I choose grid and block dimensions for CUDA kernels?에서 후속 질문 : CUDA how to get grid, block, thread size and parallalize non square matrix calculation# 블록, #threads
const int n = 128 * 1024;
int blocksize = 512; // value usually chosen by tuning and hardware constraints
int nblocks = n/nthreads; // value determine by block size and total work
madd<<<nblocks,blocksize>>>mAdd(A,B,C,n);
블록 크기와 nthreads의 차이점은 무엇입니까가? 나는 그들이 같은 사람이라고 생각하고 있습니다. 이것은 단지 오타입니까, 아니면 뭔가 빠졌습니까?
그것의 단지 오타 :
그래서 당신이 정말로 원하는 것은이 작은 정수 연산 트릭을 적용합니다. – talonmies