2014-09-16 2 views
4

OpenCL 커널에서 로컬 메모리 액세스 패턴을 최적화하고 싶습니다. 구성 가능한 로컬 메모리에 대해 어딘가에서 읽었습니다. 예 : 로컬 mem에 사용되는 양과 자동 캐싱에 사용되는 양을 구성 할 수 있어야합니다.Nvidia 플랫폼을 사용하여 OpenCL 용 로컬 (공유) 메모리 구성

또한 은행 크기가 최신 (케플러) 엔비디아 하드웨어 ( http://www.acceleware.com/blog/maximizing-shared-memory-bandwidth-nvidia-kepler-gpus)로 선택 될 수 있음을 읽었습니다. 이 점은 로컬 메모리에 저장되는 배정 밀도 값에 매우 중요합니다.

Nvidia는 CUDA 사용자를 위해서만 로컬 메모리를 설정하는 기능을 제공합니까? 나는 OpenCL에 대한 비슷한 방법을 찾을 수 없습니다. 그래서 이것은 다른 방식으로 불려지거나 정말로 존재하지 않는 것입니까?

답변

5

OpenCL을 사용할 때 불행히도 L1 캐시/로컬 메모리 구성을 제어 할 수있는 방법이 없습니다. 이 기능은 CUDA 런타임에서만 제공됩니다 (cudaDeviceSetCacheConfig 또는 cudaFuncSetCacheConfig 통해).

+0

정말인가요? 어떤 출처 또는 무엇인가? – Madhatter

관련 문제