2
GPU 커널과 호스트 기능을 겹치게하는 프로그램이 있습니다. 호스트 기능이 GPU 커널과 겹치는 부분을 확인하려면 NVIDIA의 시각적 프로파일 러를 사용하고 있습니다. 그러나 프로파일 러는 내 호스트 기능에 대한 타이밍 결과를 표시하지 않습니다. 대신 CUDA 커널의 CPU 시간 만 표시합니다.NVIDIA의 시각적 프로파일 러에 호스트 기능을위한 타이밍을 포함시키는 방법은 무엇입니까?
호스트 기능의 타이밍 결과를 시각적 프로파일 러의 타임 라인에 통합 할 수있는 방법이 있습니까?