2014-03-13 6 views
0

어떻게 든 CUDA 커널 내부의 매트릭스의 지수를 계산할 수 있어야합니다. 이 작업을위한 기능을 CUDA 스레드 내에서 호출 할 수있는 라이브러리가 있습니까? 아니면 __device__ 함수로 처음부터이 함수를 구현할 수 있을까요?CUDA 스레드에서 매트릭스의 지수를 계산하는 방법은 무엇입니까?

호스트 코드 컴파일 및 툴킷 3.2v의 nvcc 컴파일러에 Microsoft Visual Studio 2008 Express를 사용하고 있습니다.

GPU : NVIDIA 지포스 GT640 (연산 능력 3.0)

답변

0

없음 CUDA 라이브러리에 그런 일이 없습니다하지만 당신은 당신이 CUDA의 솔루션을 설계하는 데 도움이 코드를 볼 수 있습니다

https://github.com/poliu2s/MKL/blob/master/matrix_exponential.cpp

아키텍처 3.5에서 작업중인 경우 __global__ 커널을 다른 __global__ 커널에서 호출하여 호스트에서 돌아 오지 않고 (실행하려는 구성을 설정할 수 있음) 문제를 쉽게 해결할 수 있습니다 (동적 부적절 함으로 해결할 수 있음). 스레드 및 블록). 기본적으로

: CC> 3.5 카드에 작업하는 경우이

+0

을 도울 수

__global__ child(...) { .... } __global__ parent(...) { child<<< ..., ... >>>(...) } 

희망, 당신은 커널 내에서 CUBLAS 루틴을 호출 할 수 있습니다. 이렇게하면 필요한 행렬 곱셈을 수행하는 데 도움이됩니다. – JackOLantern

관련 문제