0
PAPI를 사용하여 L2 캐시 누락 횟수 데이터를 수집했습니다. 나는 4 개의 스레드 (mpirun -np 4)로 MPI 응용 프로그램을 실행했으며 각 스레드는 L2에서 캐시 누락을 읽습니다. 각 스레드는 모든 시간 소인에 대한 데이터를 출력합니다. 예 :Papi 출력을 해석하는 방법
이제Timestamp data
xxx530 thread# 0 2136
xxx531 thread# 0 3217
.. . .
. . .
. . .
. . .
xxx550 thread# 0 412334255
xxx530 thread #1 2456
xxx531 thread#1 4243
xxx532 thread #1 4567
and so on
내 qstn, 내가 스레드 0, 1, 2에 대한 타임 스탬프 xxx530에 모든 캐시 미스 값을 추가, 3 또는 내가 thrreda0,1의 최대 값을 shud shud 여부, 타임 스탬프 xxx530에 2,3?
프로그래머를 수정할 수 있으며 일부 스레드에서 메모리로 작업하지 않아도됩니까? 그런 다음이 스레드에서 카운터를 가져와 변형 ("Sum"또는 "Max"- 즉 스레드 당 카운터 또는 시스템/CPU 전체 카운터)을 선택합니다. – osgx