2014-05-19 3 views
-1

전역 메모리에 큰 배열 (> 1000000 float)이있는 CUDA 응용 프로그램이 있습니다. 통합 메모리 구문을 사용하여이 배열을 정의한다면 CUDA는 배열을 공유 메모리에 분산시켜 프로그램을 더 빨리 실행할 수있는 방법을 찾아 낼 수 있습니까? 통합 메모리 아키텍처가 전역 메모리 대신 공유 메모리를 사용한다는 것을 알고 있습니까?CUDA 6 통합 메모리 성능

답변

1

UM은 공유 메모리와 아무 관련이 없습니다. 공유 메모리는 명시 적으로 할당되고 별도로 관리되어야합니다.

programming guide

끝 부분의 UM 섹션을 검토하는 것이 좋습니다.