2010-07-30 9 views
0

PAPI를 사용하여 L2 캐시 누락 횟수 데이터를 수집했습니다. 나는 4 개의 스레드 (mpirun -np 4)로 MPI 응용 프로그램을 실행했으며 각 스레드는 L2에서 캐시 누락을 읽습니다. 각 스레드는 모든 시간 소인에 대한 데이터를 출력합니다. 예 :Papi 출력을 해석하는 방법

이제
Timestamp    data 
xxx530  thread# 0 2136 
xxx531  thread# 0 3217 
..   .   . 
.   .   . 
.   .   . 
.   .   . 
xxx550  thread# 0 412334255 

xxx530  thread #1 2456 
xxx531  thread#1  4243 
xxx532  thread #1 4567 
and so on 

내 qstn, 내가 스레드 0, 1, 2에 대한 타임 스탬프 xxx530에 모든 캐시 미스 값을 추가, 3 또는 내가 thrreda0,1의 최대 값을 shud shud 여부, 타임 스탬프 xxx530에 2,3?

+0

프로그래머를 수정할 수 있으며 일부 스레드에서 메모리로 작업하지 않아도됩니까? 그런 다음이 스레드에서 카운터를 가져와 변형 ("Sum"또는 "Max"- 즉 스레드 당 카운터 또는 시스템/CPU 전체 카운터)을 선택합니다. – osgx

답변

0

베어 L2 캐시 누락 횟수는 아무 소용이 없습니다.

또한 유용한 정보를 얻으려면 캐시 히트/메모리 액세스 횟수를 계산해야합니다.

관련 문제