sse 및 mmx 명령 세트를 살펴본 결과 3 채널 이미지 처리에 대한 지침이 없습니다. 물론 여러 작업에 대해 평균 두 이미지와 같은 동일한 지침을 사용할 수 있습니다. 그러나 선형 변환을 사용하여 채널을 언 셔플 링하거나 다른 채널을 혼합하는 것과 같은 작업에서는 32 비트 이미지를 사용하는 것이 훨씬 쉬워 보입니다.simd 명령어를 사용할 때 32 비트 이미지 처리가 24 비트 이미지 처리보다 빠릅니까?
24 비트 이미지와 32 비트 이미지의 일반적인 이미지 처리 작업의 성능이 어떻게 중요합니까?
캐싱에 대한 언급은 정말로 흥미 롭습니다. 고마워. –
실제로 내가 올바르게 기억한다면 패치를 할 수 있습니다 (이것은 버퍼링이라고 생각합니다). 그리고 L1 또는 L2 캐시에 맞는 패치 나 블럭 위에 작업을하십시오. 그런 다음 작업 블록을 행렬을 따라 이동하십시오. 플롭 카운트가 높으면 캐시 된 액세스가 패치 복사 비용을 상쇄합니다. –