sse3

    1

    1답변

    SSE 명령어를 사용하여 정수 값을 곱하고 더하는 프로그램을 작성하고 있습니다. 나는 float로 같은 프로그램을했지만 내 정수 버전에 대한 설명이 빠져있다. 내 모든 작업을 완료 한 후 수레와 는, 내가하고 일반 float 배열로 다시 드 값을 반환 : _mm_store_ps(temp4,temp3); temp4는 플로트 *이며, __m128을 TEMP

    10

    3답변

    "SSE 명령어 세트를 사용할 수 없음"이 오류와 관련하여 문제가 발생합니다. 내가 어떻게 알아낼 수 있니? 나는 ACER i7, Ubuntu 11.10을 가지고 있습니다. 아무도 도와 줄 수 있습니까? 도움이 될 것입니다! flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat pse3

    3

    1답변

    SSE에서 AVX로 사용하는 Sandbridge 프로세서 용으로 설계된 응용 프로그램이 있습니다. 이제 동일한 응용 프로그램을 Atom 프로세서에서 실행하고 싶습니다. 최근에 Atom cloverview 프로세서의 내장 지원을 위해 인터넷을 탐색했습니다. 그것이 언급하는 곳마다 SSE3까지 지원합니다. 하지만 이것은 SSE3까지만 지원된다는 것을 의미합니다

    0

    1답변

    입력에 단 정밀도 숫자가있는 AVX 명령어로 버블 정렬 알고리즘을 개발해야합니다. 아무도 내가 가장 효과적인 구현을 찾도록 도와 줄 수 있습니까? 나는 SSE3에 대한 버블 정렬 버전을했다 : global sort32 sort32: start mov eax, [ebp+8] ; float* x mov ebx, [ebp+12] ; i

    2

    1답변

    GCC에서 x264 빌드 컴파일에 관한 질문이 있습니다. x264에는 SSE3 및 SSSE3과 같은 명령어 세트를 다루는 어셈블리 코드가 있으며 기본적으로 makefile에는 자동 벡터화가 비활성화되어 있습니다. 어쨌든 -mssse3 플래그로 컴파일해야합니까, 아니면 실제로 성능이 저하 될 수 있습니까? -mssese3은 -msse3을 암시합니까? 아니면

    2

    1답변

    내 프로그램을 최적화하는 내장 함수를 사용하고 있습니다. 그러나 이제 결과를 부동 소수점 값과 비교하기 위해 __m128 벡터에있는 네 개의 요소를 합산하려고합니다. 예를 들어,이 128 비트 벡터가 있다고 가정 해 봅시다. {a, b c, d}. + b + c + d와 e를 어떻게 비교할 수 있습니까? e는 float 유형입니까? SSE2 또는 SSE3은

    3

    2답변

    SSE3 명령을 사용하기 위해 기존 벡터 및 행렬 클래스를 다시 구현하려고했는데 일련의 작업을 수행 할 때마다 이러한 "메모리 액세스 위반"오류가 발생하는 것 같습니다. 벡터 배열에 대한 연산. 나는 SSE에 비교적 익숙하지 않기 때문에 간단한 시작을했습니다. 내 벡터 클래스의 전체 내용은 다음과 같습니다. 그럼에도 불구하고 아직 많은 생성자, 접근 자 및

    11

    2답변

    인텔 i3 프로세서에서 32 개 요소 (각 1 바이트 데이터)의 합계를 줄이려고합니다. 나는 이것을했다 : s=0; for (i=0; i<32; i++) { s = s + a[i]; } 그러나 내 응용 프로그램이 훨씬 적은 시간을 필요로하는 실시간 응용 프로그램이기 때문에 더 많은 시간이 걸린다. 최종 합계가 255를 초과 할 수 있습니다

    14

    2답변

    SSE 내장 함수로 작업 한 것은 이번이 처음입니다. 인텔 SSE 내장 (SSE4.2까지)을 사용하여 간단한 코드를 더 빠른 버전으로 변환하려고합니다. 나는 많은 오류가 발생하는 것 같습니다. 코드의 스칼라 버전은 다음과 같습니다 (단순 행렬 곱셈) void mm(int n, double *A, double *B, double *C) {

    2

    1답변

    최근 ROS 작업을 시작하여 한 가지 문제에 봉착했습니다. SSE2, SSE3 및 SSSE3 CPU 확장이 필요한 클래스를 사용해야합니다. 나는 <package> <description brief="topological_map_v1"> topological_map_v1 </description> <author>me</au