CUDA에는 "요청 된 글로벌로드 처리량"과 "글로벌로드 처리량"이라는 두 가지 메트릭이 있습니다. .CUDA의 "요청 된 글로벌로드 처리량"과 "글로벌로드 처리량"의 차이점
What's the difference between "gld/st_throughput" and "dram_read/write_throughput" metrics? 글로벌로드 처리량과 드램로드 처리량의 차이를 알고 있지만 정확히 "요청 된 글로벌로드 처리량"은 무엇입니까?
내 CUDA 응용 프로그램이 전역 메모리 액세스에서 작동하는 방식을 알려고 싶다면 어떤 측정 항목을 사용해야합니까?
@ 박영배는 당신이 쓴 두 번째입니다. 대답으로 써주십시오. –