OpenCL 세계에는 지연 대기, 제출, 시작 및 종료 시간 (나노초 단위)과 같은 모든 프로파일 정보를 반환하는 함수 clGetEventProfilingInfo이 있습니다. 내가 원할 때마다 나는 그 정보를 printf
에게 줄 수 있기 때문에 매우 편리하다.CUDA 프로그램의 코드 내 프로파일 링이 있습니까?
은 PyOpenCL와 예를 들어 내 작업에 아주 유익이
profile = event.profile
print("%gs + %gs" % (1e-9*(profile.end - profile.start), 1e-9*(profile.start - profile.queued)))
과 같은 코드를 작성할 수 있습니다.
nvprof 및 company과 같은 외부 프로파일 링 도구 대신 코드에서 이러한 정보를 얻을 수 있습니까?
cudaEvent 시스템은'cudaEventElapsedTime'을 통해'profile.end-profile.start'와 동일한 기능을 제공합니다 –