짧은 배경 :OpenCL SubSlice는 CUDA Warp (SIMD)와 유사합니까?
CUDA에는 동기화가 보장되는 32 개의 스레드 인 warps 개념이 있습니다. 나는이 SIMD 동작에 의존하여 (일부 루프, 1 스레드가 끝나고 나머지 스레드가 계산에 사용하는 공유 메모리에 값을 쓰는) 동기화 호출 전체의 잠재적 오버 헤드를 피하기 위해 커널을 사용합니다.
예를 들어 OpenCL에서이 동작을 이미지화하는 방법이 있습니다. Sub_Slices? According to Intel 그들은 이런 식으로 작동하는 것 같지만 OpenCL에서 SIMD 동작을 보장하는 기능이 있습니까?
"슬라이스"(또는 "서브 스크립스")가 OpenCL 표준 용어의 명시적인 부분임을 제안하는 것처럼 보입니다. 나는 틀릴 수도 있지만, 그렇지 않다고 생각합니다. 인텔 디자인과 관련이있을 수 있습니다. 최소한 여기에서 사용하는 컨텍스트와 관련이 있습니다. 물론 "슬라이스"라는 단어는 [OpenCL 명세] (https://www.khronos.org/registry/cl/specs/opencl-2.0.pdf)에 나타나지만 한 단어를 지칭하는 명명 규칙으로 만 사용됩니다. 다차원 데이터 구조의 특정 레이어. 내가 말할 수있는 한, "서브 클래 싱"은 OpenCL 표준 스펙에 전혀 나타나지 않습니다. –
@RobertCrovella 그 점을 지적 해 주셔서 감사합니다. 나는 sublices에 관해서는 명시 적으로 질문을하지는 않겠지 만, 일반적으로는 SIMD를 명확하게하려고 노력했다. –