2013-05-17 3 views
2

GPU 커널과 호스트 기능을 겹치게하는 프로그램이 있습니다. 호스트 기능이 GPU 커널과 겹치는 부분을 확인하려면 NVIDIA의 시각적 프로파일 러를 사용하고 있습니다. 그러나 프로파일 러는 내 호스트 기능에 대한 타이밍 결과를 표시하지 않습니다. 대신 CUDA 커널의 CPU 시간 만 표시합니다.NVIDIA의 시각적 프로파일 러에 호스트 기능을위한 타이밍을 포함시키는 방법은 무엇입니까?

호스트 기능의 타이밍 결과를 시각적 프로파일 러의 타임 라인에 통합 할 수있는 방법이 있습니까?

답변

5

예 가능합니다. profiler manual에 문서화 된 NVIDIA 도구 확장 API를 살펴보십시오.

중첩 여부를 확인하려는 호스트 코드 섹션 주위에 mark a range을 입력 할 수 있습니다.

관련 문제