이론적 인 (피크) 값은 클럭 주파수, 부동 소수점 수, 병렬 명령 발행 용량, 벡터 레지스터 크기 등에 따라 달라지는 클러스터의 각 개별 코어의 성능을 기반으로합니다 핵심. 그런 다음 클러스터의 각 코어에 대한 flops/s 수를 집계하여 클러스터 수/초 수를 계산합니다.
자동차의 경우 동일한 이론상 성능은 엔진 사양에 도달 할 수있는 최대 속도입니다.
프로그램이 이론적 인 계산에 도달하려면 명령 수준의 병렬 처리가 최대이고 모든 부동 소수점 단위가 동기화 또는 메모리 액세스로 인해 지연없이 끊임없이 작동하도록 특정 순서로 특정 연산을 수행해야합니다 등등. (자세한 내용은 SO question을 참조하십시오)
자동차의 경우 바람이없는 직선에서 최고 속도를 측정하는 것과 같습니다.
물론 이러한 프로그램이 관심있는 것을 계산할 가능성은 적습니다. 따라서 HPL과 같은 벤치 마크는 고도로 최적화되고 조정 된 구현으로 선형 대수학에서 실제 문제를 사용하지만 IO 작업 및 작업 순서가 최적이 아니기 때문에 여전히 불완전합니다.프로그램이 네트워크의 많은, 또는 디스크의 통신을 필요로하는 경우 차를
, 그것은 등
, 직선, 곡선 경주 트랙에서 최고 평균 속도를 측정 비교 될 수있는 많은 클럭 사이클을 필요로하는 연산 인 경우, CPU는 산술 연산을 수행하기 전에 데이터를 기다리는 동안 유휴 상태를 유지하여 컴퓨팅 파워를 효과적으로 낭비하게됩니다. 그런 다음 실제 성능은 프로그램이 수행하는 부동 소수점 연산 수 (더하기 및 곱하기)를 수행하는 데 걸리는 시간으로 나눠서 계산됩니다.
자동차의 경우, 이는 여행 시간을 도로 필요한 시간으로 나눈 값을 적색 등이 표시된 도시의 최고 평균 속도를 측정하는 것과 같습니다.
확인. HPL은 세계 500 대 슈퍼 컴퓨터 순위에 사용되는 벤치 마크입니다. – Lemon