2014-06-15 2 views

답변

1

는 아니, 같은 아니에요.

FLOPS은 초당 부동 소수점 연산입니다. 이것은 역사적으로 부동 소수점 연산이 다른 연산과 비교할 때 매우 비싼 연산 이었기 때문에 측정으로 사용됩니다.

Instructions per cycle은주기 당 실행되는 모든 종류의 명령어의 평균입니다. 주기 당 수행 할 수있는 명령어의 수는 명령어가 수행하는 작업에 따라 많이 달라 지므로이를 측정하려면 특정 테스트 사례가 필요합니다. 예를 들어 수행 된 첫 번째 명령어가 분기가되고 CPU가 분기를 올바르게 예측하지 못하면 해당 사이클에서 실행될 유일한 명령어가됩니다. 당신이 특정 프로세서가이 측정 된 속도를 가지고 찾을 수 있습니다 this page

:

2.42 GFLOPS/core 
9.65 GFLOPS/computer 

이 초당 기가 부동 작업이다. 주기 당 FLO로 원하면 CPU 주파수로 나눕니다.

+0

해당 페이지에 위치한 플롭 번호는 비효율적입니다. 문제의 프로세서는 터보에서 3.3GHz까지의 Sandybridge이므로 Rmax/코어는 (3.3Gigacycles/second) * (2 벡터 연산/사이클) * (4 배 정밀도 플로/벡터 연산) = 26.4GFLOPS/코어 단 정밀도의 경우 그림). 달성 된 Rpeak는 작업량에 따라 다르지만 최적화 된 계산 집약적 작업의 경우 두 코어를 모두 사용하는 경우 일반적으로 40GFLOPS를 초과해야합니다. 그렇지 않으면 좋은 대답입니다 (단 하나의 명령어가 여러 개의 플롭을 나타낼 수도 있음을 지적해야 함). –

관련 문제