는 모든 GPU 쓰레드는, 예를 들어 동일한 시간 복잡도 O.가 예상 변환 : 불규칙한에서GPGPU : '비정규'변환을 처리하는 효과적인 방법은 무엇입니까? 일반에
for i=0 to 10: c[i] = a[i]*b[i]
변환, 안 : 같이 배열 결과
for i=0 to len(arr)
for k=0 to random()%100
arr[i] += 1
[2,50,32,77,1,5,66, ...] 각 요소는 대략 계산 비용을 나타냅니다.
GPGPU 프로그래밍은 '요소 별 추가', '행렬 곱셈', '컨볼 루션'등과 같은 규칙적인 변환에 매우 적합합니다. 하지만 불규칙한 변환은 어떨까요? 어떻게 '잘'GPU 쓰레드를 배포 할 수 있습니까? '좋은'커널을 디자인하는 방법? 일반적인 방법론이 있습니까?