인텔 아키텍쳐 참조 설명서 http://www.cs.princeton.edu/courses/archive/spr12/cos217/reading/ia32opt.pdf을 통해 부담없이 읽었으며 명령 대기 시간과 처리량 부록을 통해 읽었을 때 대기 시간 (클럭 사이클 수는 실행 코어에 대해 이 명령을 구성하는 모든 μops의 실행을 완료하는 데 필요합니다. sqrt 명령의 경우 divide (C-28 페이지의 경우) 명령의 대기 시간과 동일합니다. - 적어도 일부 마이크로 아키텍처의 경우 . 이 수치는 단일, 이중 및 확장 정밀도 각각 30, 40 및 44 클럭 사이클이었습니다.sqrt 및 div 명령어가 동일한 속도로 실행됩니다.
제 질문은 sqrt 명령어가 div 명령어와 마찬가지로 대규모의 프로세서 싱크 일 수 있습니까? 나는 sqrt 지침이 모든 언어로 비용이 많이 든다는 인상을 받았다.
그들은 아마 어딘가에 룩업 테이블을 사용합니다. 아마도 프로세서에 하드 코딩 된 64 비트의 주소가 관리 가능한 룩업 테이블을 만들 것이라고는 생각하지 않지만 어쩌면 – James
을 사용할 것입니다. –