나는 360,000 개의 요소를 의미하는 400x900 매트릭스를 가지고 있습니다. 블록의 스레드 수는 1024입니다. 블록 수 (정사각형 배열)는 352이며 이는 총 360,448 개의 스레드를 의미합니다. 따라서 448 개의 스레드는 스레드가 각 요소에 할당되었다고 가정 할 때 아무 것도 수행하지 않습니다. 분기 분기에 대해 읽었으며 이해했지만 여기서는 분기 문의 및 코드가 무엇인지 이해하지 못합니다.여분의 스레드에 대한 분기 문
0
A
답변
1
스레드가 CUDA의 블록으로 그룹화되기 때문에 우리는 병렬로 작업하기 위해 데이터의 실제 크기보다 스레드를 조금 더 사용합니다. 이 경우 데이터가 할당 된 스레드 만 작동하고 다른 스레드는 대기하고 아무것도 수행하지 않도록 분기가 필요합니다.
다음 게시물은 CUDA를 사용하여 AXPY를 계산하는 방법을 보여줍니다. 총 스레드 수는 항상 256의 배수이지만 커널은 임의 길이의 벡터 N
에서 작업 할 수 있습니다. 코드 if (i < n) {...}
은 추가 스레드가 아무 작업도 수행하지 않도록합니다.
https://developer.nvidia.com/content/easy-introduction-cuda-c-and-c
+0
알겠습니다. 고마워요. – Shibli
관련 문제
- 1. 기존 SQL에 여분의 문 추가
- 2. C++ 곱셈 게임 분기 문
- 3. 스레드에 대한 HashMap의 PipedOutputStream
- 4. 스레드에 대한 상호 함수
- 5. 스레드에 대한 chroot 대안
- 6. 동시 스레드에 대한 경고
- 7. 스레드에 대한 혼란
- 8. 스레드에 대한 용어집
- 9. 스레드에 대한 명명 규칙?
- 10. 분기 명령에 대한 접미사?
- 11. JOptionPane에서 스레드에 대한 비동기 통신
- 12. 기존 스레드에 대한 액세스 얻기
- 13. 스레드에 대한 자체 파괴 타이머?
- 14. 인터페이스 및 스레드에 대한 혼동
- 15. ASP.NET의 스레드에 대한 이상한 동작
- 16. 스레드에 대한 벤치 마크 자바
- 17. C의 특정 스레드에 대한 호출
- 18. Workbe 스레드에 대한 Cloudbees 지원
- 19. 스레드에 대한 Junit4 테스트 케이스
- 20. 스레드에 대한 android 대기 작업
- 21. 스레드에 대한 GetBufferLock 시간 초과
- 22. 부모 스레드에 대한 ReentrantReadWriteLock 위임
- 23. 스레드에 대한 Django 전역 데이터
- 24. QApplication의 모든 스레드에 대한 액세스
- 25. 자바 스레드에 대한 간단한 의문
- 26. 여분의 공백에 대한 CSS 구문
- 27. Django : 여분의 필드에 대한 비교
- 28. 현재 프로젝트의 복제, 분기 또는 분기 만들기에 대한 조언이 필요합니다.
- 29. 문 외부에서 문 변수 사용에 대한
- 30. 여분의 공백 여분의 공백
"발산 진술"이란 무엇입니까? –