내 소스 코드에서 profilling 커널을 코딩하려고하는데 CUDA 커널에서 여러 메트릭을 프로파일 링해야한다. CUDA 구성 요소로 PAPI를 시도했지만 효과가 없습니다. 또한 NVidia CUPTI API에 주목했지만 샘플 코드 callback_metrics는 커널 당 하나의 메트릭 만 프로파일 링하며 여러 메트릭에서 샘플 소스 코드를 변경하는 방법에 대해서는 약간 혼란 스럽습니다. 추신 : 내 소스 코드에서 profilling이 발생해야하기 때문에 nvprof 도구가 도움이되지 않습니다.Nvidia CUDA gpu 카드에서 여러 메트릭을 코드 작성하는 방법은 무엇입니까?
-2
A
답변
1
CUPTI API는 여러 기술을 사용하여 GPU에서 데이터를 수집합니다. 각 기술은 단일 커널에서 어떤 데이터를 수집 할 수 있는지에 한계가 있습니다. 더 복잡한 메트릭이나 다중 메트릭 CUPTI를 수집하려면 커널 시작을 여러 번 재생해야합니다. CUPTI에는 응용 프로그램 내에서 커널을 여러 번 투명하게 재생할 수있는 커널 재생이라는 기능이 있습니다. CUDA API 관점에서 보았을 때 커널은 실행하는데 오래 걸리는 것처럼 보입니다. 이 기능은 CUPTI_EVENT_COLLECTION_MODE_KERNEL에 수집 모드를 변경합니다
CUptiResult CUPTIAPI cuptiEnableKernelReplayMode(CUcontext context);
이
를 호출하여 사용할 수 있습니다.는 cupti_events.h 및 이벤트 모음에 대한 자세한 정보는 CUPTI 사용 설명서 섹션 CUPTI Event API을 참조하십시오.
관련 문제
- 1. cuda enabled nvidia GPU 비교
- 2. NVIDIA CUDA : 개발자 드라이버는 무엇입니까?
- 3. 연구용 nVidia GPU : 부동 정밀도
- 4. GPU 아키텍처 (Nvidia)
- 5. glGetUniformLocation은 nvidia 카드에서 -1을 반환합니다.
- 6. opengl with Nvidia gpu
- 7. NVIDIA (cuda capable), GPU 카드의 부하를 어떻게 계산합니까?
- 8. nVIDIA CUDA 드라이버는 정확히 무엇을합니까?
- 9. 네트워크화 된 CUDA GPU
- 10. Learn Nvidia CUDA
- 11. OpenCL 대 Nvidia 장치의 CUDA 성능
- 12. nvidia gpu 명령어 캐시 크기
- 13. 맥스웰에서 중복되는 데이터 전송 (GPU Nvidia)
- 14. Matlab과 GPU/CUDA 프로그래밍
- 15. CUDA Nvidia NSight 디버깅 : "CUDA 그리드 실행 실패"
- 16. 통합 gpu + 외장 장치의 cuda
- 17. GPU 프로그래밍, CUDA 또는 OpenCL?
- 18. 파스칼 카드에서 CUDA 코드가 실패했습니다 (GTX 1080)
- 19. 왜 여러 GPU CUDA 코드가 실패 했습니까?
- 20. cuda gpu : 전문 용어의 정의
- 21. 멀티 gpu CUDA 추력
- 22. OpenGL PBO가 nVidia 그래픽 카드에서 작동하지 않습니다.
- 23. Xcode에서 코드 메트릭을 캡처하는 방법은 무엇입니까?
- 24. PCI 인터페이스가있는 GPU의 nVidia CUDA
- 25. NVIDIA CUDA GPU의 이미지 프로세싱
- 26. 어떻게 CUDA GPU 성능을 결정합니까?
- 27. CUDA 스레드에서 매트릭스의 지수를 계산하는 방법은 무엇입니까?
- 28. CUDA 추력을 사용한 다중 GPU 사용
- 29. CUDA 툴킷없이 NVIDIA Nsight Eclipse Edition을 설치하는 방법은 무엇입니까?
- 30. 여러 GPU 용 SLI