어떻게 든 CUDA 커널 내부의 매트릭스의 지수를 계산할 수 있어야합니다. 이 작업을위한 기능을 CUDA 스레드 내에서 호출 할 수있는 라이브러리가 있습니까? 아니면 __device__
함수로 처음부터이 함수를 구현할 수 있을까요?CUDA 스레드에서 매트릭스의 지수를 계산하는 방법은 무엇입니까?
호스트 코드 컴파일 및 툴킷 3.2v의 nvcc 컴파일러에 Microsoft Visual Studio 2008 Express를 사용하고 있습니다.
GPU : NVIDIA 지포스 GT640 (연산 능력 3.0)
을 도울 수
희망, 당신은 커널 내에서 CUBLAS 루틴을 호출 할 수 있습니다. 이렇게하면 필요한 행렬 곱셈을 수행하는 데 도움이됩니다. – JackOLantern