CUDA의 경우 "블록이 여러 MP로 분할되지 않습니다."(http://llpanorama.wordpress.com/2008/06) . 거기에, 그러나"이해하는 방법" "블록이 여러 MP로 나누어 지 지 않습니다."?
__global__ void dummy()
{
}
int main()
{
int N=21504*40000; //21504 is the total threads I found for my Tesla M2070
dim3 grids(1,2);
dim3 thres(N,N);
dummy<<<grids,thres>>>();
return 0;
}
:/11/스레드 및 블록 -와 - 그리드 - 오 - 내 /)
그냥이 테스트하기 위해, 나는 커널에 매우 큰 블록 크기를 할당 컴파일이나 런타임 에러가 아니며 무슨 일이 일어나고 있는지 확실하지 않습니다 ...
코드를 검사 할 때 런타임 오류가 없다고 어떻게 말할 수 있습니까? – talonmies
그가 CUDA를 배우려고 할 때 블로그에있는 누군가가 인터넷에서 임의의 구식 페이지를 참조하는 대신, 나는 [CUDA C 프로그래밍 가이드] (http : // Nvidia의 developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/CUDA_C_Programming_Guide.pdf). CUDA 프로그램을 작성하기 위해 알아야 할 모든 것을 포함하고 있습니다. – tera