2011-03-08 3 views
1

아마도이 질문은 너무 일반적이지만 어쩌면 누군가가 같은 문제를 경험했습니다.Cuda 성능 문제

나는 추력을 사용하는 작은 쿠다 프로그램을 가지고 있으며 모든 것이 잘됩니다. 그것은 예상대로 작동합니다.

하지만 다른 프로그램에 동일한 프로그램을 포팅하면 전체 프로그램의 성능이 원래 컴퓨터보다 약 10 배에서 100 배 정도 느려집니다. 두 번째 시스템의 하드웨어가 더 빨라야합니다 (GTX265 대신 GTX480). 문제는 두 번째 시스템 자체에서 발생합니다. 누구가 잘못 될지 모른다는 생각을 가지고 있습니까?

+0

해결책을 찾은 것 같습니다. 하나는 GTX480 장치에서 --arch = sm_20으로 컴파일해야합니다. --arch = sm_13을 사용했습니다. – headmyshoulder

답변