simd

    4

    1답변

    길이의 배열을 정렬에 매우 유용 고유 _mm256_permutevar8x32_ps가 차선을 가로 질러 걸어 갔다 수행 할 수있는 AVX2, 8. 이제 나는 단지 AVX (아이비 브릿지)가 같은 일을 할 최소 사이클로. 데이터와 인덱스는 모두 컴파일 타임에 입력되고 알려지지 않습니다. 예를 들어, 배열이 [1,2,3,4,5,6,7,8]이고 인덱스가 [3,0,

    0

    1답변

    int, float 및 double 데이터 형식에 대해 SIMD 명령을 실행하려고합니다. 곱하기, 추가 및로드 작업이 필요합니다. _mm256_add_ps, _mm256_mul_ps 및 _mm256_load_ps은 (더블에 대한 *의 PD 종료) : 는 float 및 double 위해 나는 성공적으로 그 지시가 작동하도록 관리. (직접 FMADD 작업은 지

    1

    1답변

    SIMD 명령어의 처리량은 32 비트 정수 산술보다 낮습니다. SM2.0 (스칼라 명령어 전용 버전)의 경우 2 시간 더 낮습니다. SM3.0의 경우 6 시간이 더 낮습니다. 사용하기에 적합한 경우는 무엇입니까?

    2

    2답변

    32 비트 RGBA 이미지 버퍼가 있습니다. 1920x1080이라고 가정 해 봅시다. 일반적으로 왼쪽에서 오른쪽, 위쪽에서 아래쪽까지 RAW 버퍼입니다. 는 여기에 내가 빨리 정말하고 싶은 내용은 다음과 같습니다이 하나의 소스 버퍼에서 두 개의 새로운 버퍼 ... 는 "FILL"버퍼 ... RGB 값이 원래 버퍼의 일치를 만들 수 있습니다. 알파 값이 불투

    0

    1답변

    우리는 다른 연산의 벡터 내장 라이브러리를 만들려고하고 있으며 그 중 하나는 숫자의 절대 값을 얻고 있습니다. 그러나 교수님은 double으로 제한했습니다. 저는 x86 내장 명령 집합에 상당히 익숙하기 때문에 누군가가 저를 계몽 할 수 있기를 바랍니다. 이 내가 지금까지 무엇을 가지고 : void vectorAbs(double *x, double *y,

    2

    2답변

    나는 다음과 같은 코드를 실행하고 : #include <emmintrin.h> #include <stdlib.h> #include <stdio.h> int main(int argv, char** argc) { float a[] = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0};

    1

    2답변

    _mm_packus_epi16을 사용할 때 0보다 작은 값은 0이지만 127보다 큰 값은 음수 값이됩니다. 이 링크에 따르면, 어떤 제안을 부호없는 포화 http://msdn.microsoft.com/en-us/library/07ad1wx4%28v=vs.90%29.aspx 그러나 일이 안된다? 코드 : UnsignedSaturate 이후 __m128i re

    2

    1답변

    CUDA의 간단한 워스트 내 스레드 분산에 대해 SM은 재 컨버전스 포인트 (PC 어드레스)를 선택하고 둘 다/다중 경로를 사용하지 않은 스레드에 대해 실행 효과를 사용하지 않도록 설정합니다. 부호의 아래 부분에 예 : if(threadIdx.x < 16) { A: // do something. } else { B: /

    3

    3답변

    AVX는 부동 소수점 데이터 유형 __m256 및 __m256d 및/또는와 같은 비트 논리 연산을 허용합니다. 그러나 C++에서는 float 및 double에 대한 비트 연산을 허용하지 않습니다. 맞다면 컴파일러가 IEEE754를 사용할 지 여부와 상관없이 플로트의 내부 표현에 대한 보장이 없으므로 프로그래머는 플로트 비트가 어떻게 보이는지에 대해 확신 할

    0

    2답변

    Intel Atom Processor 용 Android x86 기반 frameweork를 개발 중입니다. 전체 프레임 워크를 구현했지만 코드에 대한 SIMD 구현 문제가 있습니다. 기본 C 코드를 실행하면 에뮬레이터와 하드웨어에서 상당한 성능을 발휘하지만 코드에 내장 옵션을 사용할 때 실제 이득은 없지만 성능은 무시할 수 있습니다. Intel i7 프로세서