gpgpu

    0

    1답변

    cuBLAS 함수 cublasSgemm을 사용하여 행렬 곱셈의 간단한 예제를 작성하려고합니다. 내 코드는 아래와 같습니다 : int m =100, n = 100; float * bold1 = new float [m*n]; float * bold2 = new float [m*n]; float * bold3 = new float [m*n]; for (i

    0

    1답변

    다음 코드에서는 크기가 200x200 인 3 개의 임의 행렬에 대해 함수 cublasSetMatrix를 사용합니다. 0.000131 - - 0.000141 사실 마다 0.121849 :이 코드의 출력이 같은 clock_t t1,t2,t3,t4; int m =200,n = 200; float * bold1 = new float [m*n]; float

    0

    1답변

    GPGPU에서 영구 스레드를 사용하는 것과 디바이스 측 엔벌 로프/네 스티드 병렬 처리를 적용 할 수있는 경우 여전히 이점이 있습니까? 필자는 이전 성능을 얻기 위해 구형 하드웨어에 지속적인 스레드가 필요한 몇 가지 오래된 문서를 읽었으며 장치 측 엔큐/네 스티드 병렬 처리를 사용하면 관련 기술과 관련성이 없는지 확실하지 않습니다. 자식 작업이 부모로부터

    0

    1답변

    저는 OpenCL Khronos 서적, GATech 자습서, NYU 자습서 등 여러 가지 자료를 훑어 보았습니다. 그러나 나는 아직도 완전히 이해하지 못한다. 커널과 프로그램 객체의 차이점은 무엇입니까? 지금까지 가장 최선의 방법으로 설명하기는 날 위해이지만,이 날 완벽하게 이해하는 것만으로는 충분하지 않습니다 : 프로그램 객체를 : 프로그램 객체는 일부

    1

    1답변

    According to Wikipedia, the Iris Graphics 6100 has 48 execution units (EU) with each having a pair of 128 bit FPUs. 그래서 각 EU는 8 부동 소수점 형식의 벡터를 지원해야합니다. 장치가 GPU의 기본 벡터 너비에 대해 폴링되면 모든 유형은 이중을 제외하고 1로 표시

    0

    1답변

    내가 추력 예제를 사용하여 내 첫 번째 VexCL 프로그램을 컴파일하려고의 구성원이 아닌 raw_ptr 나는 다음과 같은 오류 메시지가 얻을 : raw_ptr는 '벡스 :: 백엔드의 구성원이 아닌를 :: 여기 오픈 CL : device_vector은 '코드 vex::Context ctx(vex::Filter::Env && vex::Filter::Count(

    2

    2답변

    스크립트에서 내 키 체인으로 PGP 공개 키를 가져 오려고하지만 파일에 내용을 쓰고 싶지 않습니다. 난 그냥 gpg --import를 호출하고 문자열로 공개 키를 가져올 수 있도록 curl http://example.com/pgp-public-key -o /tmp/pgp && gpg --import /tmp/gpg 가 어떻게이 스크립트를 작성할 수 있습

    4

    1답변

    AMD GPU 용 OpenCL 프로그램을 최적화해야한다는 요구 사항이 있습니다. GCN ISA 어셈블리에서 핵심 OpenCL 커널을 다시 작성하려고하지만 Windows와 Linux를 모두 지원해야합니다. Linux 용 작업을 수행 할 수있는 것처럼 보이지만 Windows를 지원하지 않는 ROCm 플랫폼을 발견했습니다. 이것을 수행하는 데 사용할 수있는 도구

    1

    1답변

    어떻게 clGetDeviceInfo를 사용하여 CL_DEVICE_ADDRESS_BITS을 얻습니까? https://www.khronos.org/registry/cl/sdk/1.0/docs/man/xhtml/clGetDeviceInfo.html

    0

    2답변

    두 개의 정사각형 행렬의 크로네 커 곱을 계산하기 위해 손으로 작성한 방법을 확인하기위한 다음 코드가 있습니다. 첫 번째 부분은 사실 a과 b을 반복하고 바둑판 식으로 배열하는 방식이 각각 동일한 출력을 생성하는지 확인합니다. import pyopencl as cl import numpy from time import time N = 3 num_i