1
LLVM의 NVPTX 백엔드 (NVIDIA 제공)는 CUDA5/Compute Capability 3.5 장치에있는 새로운 동적 병렬 처리 기능을 지원합니까?LLVM NVPTX 백엔드 CUDA5 동적 패럴림
LLVM의 NVPTX 백엔드 (NVIDIA 제공)는 CUDA5/Compute Capability 3.5 장치에있는 새로운 동적 병렬 처리 기능을 지원합니까?LLVM NVPTX 백엔드 CUDA5 동적 패럴림
CUDA Dynamic Parallelism Programming Guide의 "PTX에서의 장치 측 시작"절에 몇 가지 정보가 있습니다.
이// When .address_size is 64
.extern .func(.param .b32 func_retval0) cudaLaunchDevice
(
.param .b64 func,
.param .b64 parameterBuffer,
.param .align 4 .b8 gridDimension[12],
.param .align 4 .b8 blockDimension[12],
.param .b32 sharedMemSize,
.param .b64 stream
)
;
그래서 내가 대답은 LLVM에서이 기능을 선언하는 것입니다한다고 가정 가정 : cudaLaunchDevice()라는 함수가 PTX에서 액세스 할 수 있으며 사용자가 단지 PTX에서이 함수를 선언하고 호출하는 것으로 보인다 IR을 누른 다음 사용하십시오. 이 솔루션을 테스트하지 않았습니다.