2013-06-28 1 views

답변

2

CUDA Dynamic Parallelism Programming Guide의 "PTX에서의 장치 측 시작"절에 몇 가지 정보가 있습니다.

// When .address_size is 64 
.extern .func(.param .b32 func_retval0) cudaLaunchDevice 
(
.param .b64 func, 
.param .b64 parameterBuffer, 
.param .align 4 .b8 gridDimension[12], 
.param .align 4 .b8 blockDimension[12], 
.param .b32 sharedMemSize, 
.param .b64 stream 
) 
; 

그래서 내가 대답은 LLVM에서이 기능을 선언하는 것입니다한다고 가정 가정 : cudaLaunchDevice()라는 함수가 PTX에서 액세스 할 수 있으며 사용자가 단지 PTX에서이 함수를 선언하고 호출하는 것으로 보인다 IR을 누른 다음 사용하십시오. 이 솔루션을 테스트하지 않았습니다.