책 Programming Massively Parallel Processors
에서 gflops의 수는 다른 행렬 곱셈 커널의 효율성을 비교하는 데 사용됩니다. 내 컴퓨터에서이 커널을 어떻게 계산할 수 있습니까?행렬 곱셈 커널의 gflops를 측정하는 방법은 무엇입니까?
NVIDIA 포럼의 어떤 곳에서이 '알고리즘'을 찾았지만 유효한지 또는 시간 2가 어디서 비롯되는지 모릅니다.
NumOps = 2 * pow(MatrixSize,3)
gflops = 1.0e-9 * NumOps/ExecutionTime
p.s. 태그를 자유롭게 변경하십시오.
+1. 필자는 모든 최신 nvidia gpus를 포함하는 내장 FMAD (fused multiply and add) 명령을 하드웨어에 추가합니다. 사람들은 MatrixSize^3 용어 앞에 2의 인수를 사용할지 여부를 묻습니다. 당신이 그것을 일관되게하는 한별로 중요하지 않아야합니다. –