gpgpu

    -1

    1답변

    나는 한동안 openCl 프로그램을 코딩 해왔다. 이제는 .pam 형식의 이미지를 읽은 다음 그대로 저장하는 간단한 프로그램을 만들려고한다. 이제 문제는 이미지를 열 때 이름을 지정하면 처음 2dImage를 만들 때 오류 -40이 반환된다는 것입니다. 여기 #define SEPARATOR "=====================================

    -5

    1답변

    나는 화합을 사용하고 있으며 HLSL을 사용하여 GPU에 바이트 배열을 보내려고합니다. 내가 ByteAddressBuffer에 대해 알고 있지만, 나는 그것을 사용하는 방법을 모른다. 나는 단지 "바이트"를 GPU에 보내는 방법을 알고 싶을뿐입니다. 내 계산 쉐이더에 StructuredBuffer<byte>을 갖고 싶습니다.

    2

    1답변

    주제를 더 잘 이해하기 위해 MATLAB에서 신경망을 구현했습니다. 내 GPU에서 코드를 실행하려고 했으므로 모든 매트릭스를 gpuArray()으로 초기화했지만 성능이 향상되지 않았습니다. 또한 GPU가 CPU보다 느린 경우가 있습니다. 나는 이미 arrayfun, pagefun과 같은 기능을 사용하는 방법을 배웠다. 역순으로 모든 레이어에 대해 델타 오류

    17

    1답변

    나는 nvidia-smi -l 1이 매초마다 GPU 사용법을 알려줄 것이라는 것을 안다. 그러나, 나는 Volatile GPU-Util이 실제로 의미하는 것에 대한 설명을 감사하게 생각합니다. 총 SM보다 사용 된 SM의 수 또는 점유율입니까? +--------------------------------------------------------------

    1

    1답변

    Metal에서 n 크기 벡터에 대한 표준 또는 제곱 길이 함수를 작성하려고합니다. 이를 위해 모든 스레드가 각 요소를 정사각형으로 만들도록 계획 한 다음 하나의 스레드를 선택하여 모든 요소를 ​​합산했습니다. #include <metal_stdlib> #include <metal_compute> using namespace metal; kernel

    1

    1답변

    실제로 ManagedCUDA를 사용하는 C# 응용 프로그램에서 내 GPU 사양을 쿼리하려고합니다. 그래서 문서를 살펴보면 GPU에서 날짜를 저장하도록 설정된 많은 변수가있는 "CudaDeviceProperties"라는 클래스가 있다는 것을 알았습니다. 그러나 어떻게 사용하는지 잘 모릅니다. 내가 클래스를 설정하는 "진짜"CUDA처럼 모든 기능을 보지 않았다

    0

    2답변

    저는 GPGPU 프로그래밍을 처음 접했습니다. 동기화를 많이 필요로하는 알고리즘을 구현하려고합니다. 하나의 작업 그룹 (글로벌 및 로컬 크기가 동일한 값을 가짐)을 사용합니다. 문제가 생깁니다 : 문제점의 크기가 초과 될 때까지 프로그램이 올바르게 작동합니다. addedValue [0]에 너무 [123 (123)와 같은 65에서 다른 값 (다음 diffre

    1

    1답변

    OpenCL을 처음 사용합니다. 현재 큰 1 차원 배열을 만들고 있습니다. 배열의 크기는 약 800 만입니다. __kernel void gpuScoring(__global int *Counts, __global int *value, int width, int height, __global int *output){ int gid = get_glob

    0

    1답변

    저는 방금 CUDA의 __byte_perm 내장 함수와 동일한 AMD를 발견했습니다. amdgcn_ds_swizzle (또는 적어도 바이트 순열 함수와 같다고 생각합니다.) 내 문제는 이것입니다 : CUDA의 바이트 퍼밋은 2 개의 부호없는 32 비트 정수를 취한 다음 선택기 인수 (16 진수 값으로 제공됨)의 값에 따라이를 치환합니다. 그러나 AMD의 s

    -2

    2답변

    Udacity의 "Intro to Parallel Programming"의 Quiz : Thread 및 Blocks에서 "주어진 SM 에서 실행되는 모든 스레드가이 문제를 해결하기 위해 협력 할 수 있습니다."라는 문구가 true 또는 false인지 묻습니다. 대답은 거짓이지만 나는 그것이 사실이어야한다고 생각한다 : "must"보다는 "may"을 사용한다