GPU (선호 OpenCL) 용 프로그램을 작성하고 싶습니다. 계산의 상당 부분은 비트 배열 (길이 또는 int로 묶여 있음)에서 1의 수를 세는 것으로 구성됩니다.OpenCL : GPU에서 32 비트 및 64 비트 popcnt 명령?
그래서 현대 CPU에서는 네이티브 __popcnt 명령을 사용합니다. 인터넷상의 여러 장소에서 현대 GPU를 읽었습니다.이 명령어는 하드웨어에도 포함되어 있습니다.이 명령어는 저에게 큰 스피드 업이 될 것입니다. (최소한 32 비트는 64 비트가 확실하지 않습니다.)
그러나이 명령어는 우리에게 아무런 의미가 없습니다. 따라서 :
1) 어떤 지침을 가지고있는 GPU를 어떻게 찾을 수 있습니까? (그래도 내 GPU를 구입해야하므로 현대적인 고급 제품이 될 것입니다. 아마 Radeon HD7000 시리즈 또는 nVidia Kepler)
2) OpenCL 또는 이와 유사한 GPU 언어에서이 명령어를 호출하는 방법 2) ?