2016-12-28 3 views
1

OpenACC로 변환 한 간단한 CUDA 코드가 있습니다. 내 모든 커널은 예상대로 병렬 처리되었으며 내 CUDA 커널과 비슷한 성능을 보입니다. 그러나 장치 간 메모리 전송으로 성능이 저하됩니다. 내 CUDA 코드에서는 고정 된 메모리를 사용하므로 성능이 훨씬 향상되었습니다. 불행히도 OpenACC에서는 고정 된 메모리를 활용하는 방법을 모릅니다. 나는 문서에서 아무것도 찾을 수 없었다. 누군가가 고정 된 메모리를 사용하는 간단한 OpenACC 예제를 제공 할 수 있습니까?OpenACC의 고정 메모리 (PGI 컴파일러 사용)

PS : 나는 "-ta = 테슬라 : 고정", PGI 16.10-0 64 비트 컴파일러

답변

3

사용은 "테슬라"대상의 "고정"하위 옵션을 사용하고 있습니다. "-help -ta"플래그를 통해 사용 가능한 모든 하위 옵션을 볼 수 있습니다.

+0

대단히 감사합니다. 그것은 작동합니다! 너는 최고야! – AstrOne

관련 문제