2012-11-21 4 views
3

NVIDIA GPU 성능에 대한 질문이 있습니다. 두 배열 사이의 보간을 수행하는 구현이 있습니다. 선형 메모리에 투영 된 텍스처를 사용하는 것이 CUDA- 배열을 사용하는 것보다 빠릅니다. 지금은 하나의 GPU에서만 시도했습니다. 이 문제는 모든 GPU에서 발생합니까 아니면 다른 점이 있습니까? 랩탑에서 GPU를 사용하고 있습니다. 데스크톱 GPU가 훨씬 빠릅니까? 그 순간에 나는 단지 2-3 배의 속도 향상을 얻었습니다.텍스처가있는 CUDA의 GPU 성능

나는 어리석은 질문처럼 보일지 모르지만 많은 GPU에서 텍스처로 작업 한 사람의 답변에 감사 할 것입니다. CUDA-Arrays (캐시 최적화가 있어야 함)를 사용하는 것이 더 느리다는 점이 나에게 이상한 일이다.

저는 NVIDIA Quadro 2000m에서 작업 중이며 I7-2860QM @ 2,50GHZ (구현 사례)와 비교하고 있습니다. 이것은 공정한 경주인가?

+0

여기에서 반대의 경우 쿠다 배열은 피치 메모리보다 빠릅니다. https://devtalk.nvidia.com/default/topic/504608/cuda-arrays-vs-pitch-linear-texturing/ –

+0

그냥 확인하십시오 - 전역 메모리 액세스 대 텍스처 또는 선형 메모리의 텍스처와 CUDA- 배열의 텍스처에 대해 이야기하고 있습니까? 후자의 경우, 아래의 나의 대답은 적용되지 않습니다. – tera

+0

선형 메모리의 텍스처 대 큐다 어레이의 텍스처 – Silve2611

답변

1

계산 기능이 2.0 이상인 캐시와 전역 메모리 및 텍스처를 포함하므로 텍스처가 CC 1.x 시대에서 갖는 주요 이점은 더 이상 존재하지 않습니다.

반대로 텍스처에 대해 언급 한 사실은 여러 인수를 저장하고 레지스터에 고정 배선 레이아웃의 값을 반환해야하기 때문에 레지스터 압박을 높일 수 있다는 것입니다. 또한 전역 메모리의 캐시는 텍스처 메모리의 캐시보다 큽니다. 따라서 텍스처를 통해 메모리를 읽는 것이 전역 메모리에 직접 액세스하는 것보다 느려질 수 있습니다.

하이 엔드 데스크톱 GPU가 모바일 장치보다 약 2 배에서 5 배 빠르더라도이 특성은 모바일 GPU 또는 데스크톱 GPU에서 동일해야합니다.