입자 시뮬레이션을하고 있고 병목 현상이 조금 있습니다. UAV를 사용하여 RW 쓰기가 가능합니다. 단일 플로트 버퍼가 약 10 배 정도 느립니다. 실험에서 대역폭의 부족은 없지만 액세스 시간 자체만으로는 부족한 것으로 보입니다. 나가는 데이터가 특정 순서로 있어야하기 때문에 글을 적어 두는 것이 좋습니다. 이것은 DX10/SM4 하드웨어에 있습니다. 몇 가지 질문이 있습니다. 쉐이더의 출력이 연속적이 아니기 때문에 더 큰 데이터 청크를 작성하는 것 이외에는 속도를 높이는 방법이 있습니까? 그렇지 않다면 DX11 등급 하드웨어가 UAV를 사용하는 것이 더 빠릅니까?DirectCompute 버퍼 속도로 쓰기
1
A
답변
0
쉐이더 코드를 프로파일 링하려면 시스템에 GPU 쿼리를 추가해야합니다.
http://mynameismjp.wordpress.com/2011/10/13/profiling-in-dx11-with-queries/
그것은 DX11에있어하지만이 포트를 통해 정말 간단해야하므로 기능도 DX10에 : 여기를 설명하는 링크입니다. 계산 거기에 다른 측면을하지만 첫 번째는 함께 플레이하는 것
후 : 8,16,32,64 같은
[numthreads(TGX, 1, 1)]
시도 값과 스위트 스폿 (sweet spot)을 찾아보십시오 (잊지 마세요 귀하의 파견에 나눕니다).
관련 문제
- 1. DirectCompute
- 2. DirectCompute 정보
- 3. C++ 쓰기 int 버퍼
- 4. OpenCL 대 DirectCompute?
- 5. IOCP 및 덮어 쓰기 버퍼
- 6. Pika : 버퍼 쓰기 경고 초과
- 7. 최적 버퍼 스트림 쓰기 프로세스
- 8. GPU 프로그래밍을위한 DirectCompute 대 OpenCL?
- 9. 하드 디스크 쓰기 버퍼 오류를 방지하려면 어떻게합니까?
- 10. C# : SerialPort : 읽기 및 쓰기 버퍼 크기
- 11. 올바른 이맥스에서 js2 모드로 버퍼 들여 쓰기
- 12. 3D 스프라이트, 정확한 깊이 버퍼 정보 쓰기
- 13. 속도로 배열 병합/조작
- 14. 고정 속도로 SetText
- 15. 부드러운 속도로 이미지 회전
- 16. 다양한 속도로 쓸어 넘기.
- 17. 프레임 버퍼/컬러 버퍼?
- 18. 자동 쓰기 VIM 버퍼 <alt-tab>
- 19. 읽기/쓰기 단일 컨텍스트에서 여러 GPU의 OpenCL 메모리 버퍼
- 20. 버퍼 란 무엇입니까? 버퍼링 된 읽기 및 쓰기 란 무엇입니까?
- 21. response.getOutputStream()에 대한 서블릿 클래스의 XSS 취약성 문제 쓰기 (버퍼)
- 22. OpenCL은 버퍼 메모리의 1/4에서 읽기/쓰기 만하고 때때로 충돌합니다.
- 23. 저장소 버퍼 란 무엇입니까?
- 24. SD 카드 쓰기 성능
- 25. jQuery 이벤트가 증가하는 속도로 발생합니다.
- 26. UIScrollView에서 다른 속도로 배경을 스크롤하십시오.
- 27. 주어진 속도로 opengl 안드로이드 이동
- 28. 특정 속도로 stdout 출력 수행
- 29. 특정 속도로 내 객체 이동
- 30. jQuery, 요소를 다른 속도로 스크롤하십시오.