2016-08-03 2 views
0

각 커널에 대해 warp_execution_efficiency를 얻을 수 있지만 프로그램의 warp_execution_efficiency를 어떻게 얻을 수 있습니까?CUDA Warp 실행 효율성

답변

2

참고 : 모든 커널에서 단일 숫자를 계산하는 것이 최적화 목적으로는 유용하지 않을 수 있습니다.

NVIDIA의 프로파일 러는 커널 중심이므로 해당 정보를 직접 쿼리하는 것은 불가능합니다. 그러나 nvprof --csv --metrics warp_execution_efficiency을 실행 한 다음 Excel, R 또는 원하는 통계 소프트웨어에 출력을 넣고 거기에 엉망으로 만들 수 있습니다.

warp_execution_efficiency에는 평균이 포함되므로 평균을 취할 수는 없습니다. 비주얼 프로파일 러가 제공하지 않는 편리한 시각화를 얻을 수 있습니다.