AVX를 사용하여 정수 (_int64) 연산을 최적화하려고합니다. 그러나, 나는 심지어 간단한 조작을 추가 할 수 없다. 계속해서 불법 교육을하고있어. 내가 잘못하고있는 것에 대해 Pls를 수정할 수 있습니까? 감사합니다AVX 정수 연산 수행
for (int i = 0; i < 1; i+=4)
{
__m256i rA, rB, rC;
__m256i *iu, *ju, *ku;
iu = (__m256i *)(MatrixAiB1 + i);
ju = (__m256i *)(MatrixAjB1+ i);
ku = (__m256i *) (store+ i);
rA=_mm256_load_si256(iu);
rB=_mm256_load_si256(ju);
rC=_mm256_add_epi16(rA,rB);
_mm256_store_si256(ku,rC);
}
cpuid : [여기] (http://msdn.microsoft.com/en-us/library/hskdteyh (v = vs.100) .aspx) 또는 [여기] (http : // en .wikipedia.org/wiki/CPUID) – neagoegab