OpenCL 커널에서 로컬 메모리 액세스 패턴을 최적화하고 싶습니다. 구성 가능한 로컬 메모리에 대해 어딘가에서 읽었습니다. 예 : 로컬 mem에 사용되는 양과 자동 캐싱에 사용되는 양을 구성 할 수 있어야합니다.Nvidia 플랫폼을 사용하여 OpenCL 용 로컬 (공유) 메모리 구성
또한 은행 크기가 최신 (케플러) 엔비디아 하드웨어 ( http://www.acceleware.com/blog/maximizing-shared-memory-bandwidth-nvidia-kepler-gpus)로 선택 될 수 있음을 읽었습니다. 이 점은 로컬 메모리에 저장되는 배정 밀도 값에 매우 중요합니다.
Nvidia는 CUDA 사용자를 위해서만 로컬 메모리를 설정하는 기능을 제공합니까? 나는 OpenCL에 대한 비슷한 방법을 찾을 수 없습니다. 그래서 이것은 다른 방식으로 불려지거나 정말로 존재하지 않는 것입니까?
정말인가요? 어떤 출처 또는 무엇인가? – Madhatter