2011-08-03 3 views
0

나는 GPGPU의 공유 메모리 마운트를 계산하고 카드를 구입하지 않고도이를 예측할 수 있습니까?opencl 하드웨어의 로컬 mem

현재 내 랩톱에 16K 공유 메모리가있는 GTS 330M이 있습니다. 및 16K + 32K = 48K 공유 메모리가있는 GTX 480입니다.

테슬라 카드를받는 것이 GTX 카드와 동일한 경우 더 많은 mem pr 블록을 제공하는지 알고 싶습니다.

어떻게 알 수 있습니까? 나는 NVIDIA의 사이트에서 스펙을 살펴볼 수 없습니다 ... 아마 AMD GPGPU가 더 좋을 것입니다. 어떻게 이것을 알아낼 수 있습니까?

내가 데이터가 PCI-E 버스를 통해 전송 될 필요로 누군가가

+1

Amazon EC2 클러스터 GPU 인스턴스 (테슬라 M2050 한 쌍당 $ 2.10/시간)를 얻고 테스트 프로그램을 실행하여 성능 및 구매 가치 여부를 결정합니다. AMD와 NVidia GPU의 상대적 성능을 예측하는 것은 매우 어렵습니다. 그 이유는 아키텍처가 매우 다른 방식이기 때문입니다. – user57368

답변

2

NVIDIA 하드웨어의 경우 모든 CUDA/OpenCL 지원 카드의 공유 메모리 구성은 CUDA 4.0 프로그래밍 안내서의 부록 F에 설명되어 있습니다.

Ferm Telsa 카드에 대한 질문에 대답하려면 런타임시 선택할 수있는 공유 메모리의 GTX 480 - 16kb 또는 48kb와 동일한 공유 메모리 구성을가집니다.

+1

동일한 컴퓨팅 성능을 가진 모든 NVIDIA GPU는 SM 당 동일한 양의 공유 메모리를 사용합니다. 현재 CC> = 2.0 == 48KB를 의미합니다. CC <2.0 == 16KB. – harrism

2

을 도울 수 있기를 바랍니다, 다른 장치의 전역 메모리는 CPU의 메모리를 사용하는 것만 큼 느립니다. 입력 데이터를 분리 할 수 ​​없기 때문에 메모리가 속도보다 큰 병 목이라면 Intel SandyBridge 또는 AMD Fusion과 같은 벡터 가능 CPU에서 OpenCL을 사용해보십시오.

+0

내가보고있는 목적을 위해, Gpu에서 초기 데이터 만 사용하여 데이터를 생성 할 수 있습니다. 버스 병 목 문제는 해결해야합니다. –

1

JavaCL 하드웨어 보고서 http://nativelibs4java.sourceforge.net/webstart/OpenCL/HardwareReport.jnlp을 실행 하시겠습니까?

+0

-1 그게 표준 OSX에서 실행되지 않습니다 뭐든, 그것은 단지 내가 이미 가지고있는 하드웨어를 곤충 것 같습니다? –

+0

아마 Apple JDK/JRE를 설치해야합니다. ( –

+0

이 진술을 정정하고 JavaCL Hardware Report가 Mac에서 작동 함을 지적했습니다 (2012 년 1 월 현재). 그러나 MacBook의 경우, 분리 된 비디오 카드를 사용하거나 충돌 할 수 있습니다. 또한 제작자가 피하려고했던 것을 지원하기 위해 카드가 있어야합니다. – Pridkett