SM 당 48kB 공유 메모리가 있고 공유 메모리에 32kB를 할당하는 커널을 만들면 이는 동시에 하나의 SM에서만 하나의 SM을 실행할 수 있다는 것을 의미합니까?CUDA 공유 메모리 사용량
0
A
답변
2
네, 맞습니다.
공유 메모리는 모든 "상주"스레드 블록의 "발자국"을 지원해야합니다. SM에서 스레드 블록을 시작하려면이를 지원할 충분한 공유 메모리가 있어야합니다. 그렇지 않으면 현재 실행중인 스레드가 완료 될 때까지 대기합니다.
Maxwell GPUs (cc 5.0, 5.2)으로 도착하는 데 약간의 차이가 있습니다. 이 GPU는 공유 메모리 64KB (cc 5.0) 또는 96KB (cc 5.2)를 지원합니다. 이 경우 단일 스레드 블록에서 사용할 수있는 최대 공유 메모리는 여전히 48KB로 제한되지만 단일 스레드에서 여러 스레드 블록이 총 48KB 이상을 사용할 수 있습니다. 이는 cc 5.2 SM이 32KB 공유 메모리를 사용하는 경우에도 2 개의 스레드 블록을 지원할 수 있음을 의미합니다.
관련 문제
- 1. CUDA Fortran에서 공유 메모리 사용량 확인
- 2. CUDA 코드의 상수 메모리 사용량
- 3. CUDA 프로필러 : 메모리 계산 및 컴퓨팅 사용량
- 4. CUDA 공유 메모리 주소 지정
- 5. 는 CUDA : 공유 메모리 할당
- 6. 후드 질문에서 CUDA 공유 메모리
- 7. CUDA 공유 메모리 이해 문제
- 8. CUDA. 공유 메모리 대 상수
- 9. CUDA 프로그래밍 - 공유 메모리 구성
- 10. 공유 모델을 사용하는 Entity Framework 메모리 사용량
- 11. cuda nbody 시뮬레이션 - 공유 메모리 문제
- 12. CUDA : 공유 메모리 연산 이전의 __syncthreads()?
- 13. CUDA : 테두리가 겹치는 공유 메모리 할당
- 14. CUDA : 대용량 2D 배열을 통한 공유 메모리
- 15. CUDA 공유 메모리 배열 - 홀수 동작
- 16. 메모리 사용량
- 17. Linux에서의 메모리 사용량 R
- 18. CUDA 메모리 뱅크가 충돌합니까?
- 19. CUDA : cudaEvent_t 및 cudaThreadSynchronize 사용량
- 20. Cuda 다른 메모리 할당
- 21. PostgreSQL의 전체 메모리 사용량 제한
- 22. 메모리 사용량 VS. iphone의 CPU 사용량
- 23. CUDA 6 통합 메모리 성능
- 24. CUDA 글로벌 메모리 복사
- 25. SDL 메모리 사용량
- 26. uicomponent 트리 메모리 사용량
- 27. .NET WinForm 메모리 사용량
- 28. 파이썬 및 메모리 사용량
- 29. Django 성능/메모리 사용량
- 30. CGPDFDocumentCreateWithURL 메모리 사용량
왜이 경우 3 개의 스레드 블록이 필요하지 않습니까? – Seltymar
아마도 3 개의 스레드 블록. –