Intel SSE intrinsics에 대한 다양한 산술 연산과 관련하여 질문이 있습니다. _mm_add_ps와 Vs.의 차이점은 무엇입니까? _mm_add_epi8/16/32? 내 데이터가 항상 정렬되도록하고 싶습니다. 샘플 코드에서Intel SSE SIMD 내장 함수로 작업
나는이 작업을 수행 할 때
__m128 u1 = _mm_load_ps(&V[(i-1)]);
나는 세그먼트 오류를 얻을. 하지만 이렇게하면 :
__m128 u1 = _mm_loadu_ps(&V[(i-1)]);
잘 작동합니다.
posix_memalign((void**)&V, 16, dx*sizeof(float));
누군가가이 문제를 설명 할 수 있습니다 :
나는 내 데이터 내가 이런 식으로 배열을 선언 정렬 원하기 때문에.
, 당신이 실제로 알고 싶어? 다른 추가 사항의 차이점은 데이터를 처리하는 데이터 유형이 무엇인지입니다. – harold