최신 ARM 프로세서에는 PLD 및 PLI 명령어가 포함되어 있습니다.ARM의 프리 페치 명령어
비 순차적 인 메모리 액세스 패턴을 가지고 있지만 내 코드가 자연스럽게 이해할 수있는 패턴이있는 (C++의) 엄격한 내부 루프를 작성하고 있습니다. 현재 메모리 위치를 처리하는 동안 다음 위치를 미리 가져올 수 있다면 상당한 속도 향상을 기대할 수 있습니다.이 속도가 빠르면 실험 가치가 있다고 기대할 수 있습니다!
저는 ARM의 새로운 고가의 컴파일러를 사용하고 있습니다.이 특별한 루프는 말할 것도없고, 어디서나 PLD 명령어를 포함하지 않는 것처럼 보입니다.
내 C++ 코드에 명시 적 프리 페치 명령어를 포함하려면 어떻게해야합니까?
최적화 된 특정 루프의 예가 질문에 포함되어있는 경우 참여자는 PLD 지침과 별도로 최적화를 찾는 데 도움이 될 수 있으며 구체적인 예를 제시 할 수 있습니다. –