2012-06-12 3 views
1

입자 시뮬레이션을하고 있고 병목 현상이 조금 있습니다. UAV를 사용하여 RW 쓰기가 가능합니다. 단일 플로트 버퍼가 약 10 배 정도 느립니다. 실험에서 대역폭의 부족은 없지만 액세스 시간 자체만으로는 부족한 것으로 보입니다. 나가는 데이터가 특정 순서로 있어야하기 때문에 글을 적어 두는 것이 좋습니다. 이것은 DX10/SM4 하드웨어에 있습니다. 몇 가지 질문이 있습니다. 쉐이더의 출력이 연속적이 아니기 때문에 더 큰 데이터 청크를 작성하는 것 이외에는 속도를 높이는 방법이 있습니까? 그렇지 않다면 DX11 등급 하드웨어가 UAV를 사용하는 것이 더 빠릅니까?DirectCompute 버퍼 속도로 쓰기

답변

0

쉐이더 코드를 프로파일 링하려면 시스템에 GPU 쿼리를 추가해야합니다.

http://mynameismjp.wordpress.com/2011/10/13/profiling-in-dx11-with-queries/

그것은 DX11에있어하지만이 포트를 통해 정말 간단해야하므로 기능도 DX10에 : 여기를 설명하는 링크입니다. 계산 거기에 다른 측면을하지만 첫 번째는 함께 플레이하는 것

후 : 8,16,32,64 같은

[numthreads(TGX, 1, 1)] 

시도 값과 스위트 스폿 (sweet spot)을 찾아보십시오 (잊지 마세요 귀하의 파견에 나눕니다).

관련 문제