2014-07-04 1 views
1

저는 8 개의 NUMA 도메인을 가진 AMD abu-dhabi 아키텍처에서 다중 스레드 프로그램을 실행하고 있습니다. 나는 서로 다른 코어에서 쓰레드를 할당하고 다른 메모리 정책을 시도하기 위해 numactl을 사용하고있다. NUMA 도메인에 의해 정렬 된 캐쉬 미스/히트를 측정하고 싶지만 perf와 같은 도구를 사용하여 전체 카운터를 얻었습니다. numastat, likwid 및 hpctoolkit과 같은 도구를 이미 검토했습니다. NUMA 도메인으로 구분 된 표준 성능 카운터를 얻을 수있는 도구에 대해 알고 있습니까?Linux의 NUMA 노드가 캐시 미스/히트를 측정하는 도구는 무엇입니까?

+0

perf 통계에 --per-socket 매개 변수를 사용하면 카운터를 가져올 수있었습니다. AMD 아키텍처에서는 소켓 당 2 개의 NUMA 노드가 있기 때문에 정확히 원하는 것은 아니지만. – Jofe

답변

1

귀하의 필요에 따라 numastat가 충분하지 않습니까?

>numastat 
          node0   node1   node2   node3 
numa_hit    2511148413  2668024472  2541805396  2631938751 
numa_miss     687767   186973   510852   79546 
numa_foreign    544853   1772504   1306738   1461626 
interleave_hit    14268   14291   14281   14309 
local_node   2509822983  2667700745  2541325673  2631417570 
other_node    2013197   510700   990575   600727 

          node4   node5   node6   node7 
numa_hit    2551615375  2287945142  2199394273  2506262343 
numa_miss    1178554   1863536   2037710   1278384 
numa_foreign    1709984   541463   241266   244888 
interleave_hit    14287   14274   14291   14294 
local_node   2551212630  2278515165  2198877939  2505436756 
other_node    1581299  11293513   2554044   2103971 
+0

안녕하세요. 답변 해 주셔서 감사합니다. Numastat는 어떤 노드가 페이지를 요청했는지 고려하지 않고 요청 된 페이지가 특정 노드에 있었는지 아닌지를 보여주기 때문에 충분한 정보를 제공하지 않습니다. 얼마나 많은 요청이 도메인 외부와 특정 노드를 만들었는지 알고 싶습니다. 내가 무슨 말하는지 이해 하겠니? – Jofe

0

Intel PCM 패키지에는 pcm-numa.x라는 도구가 있습니다. 각 코어가 로컬 NUMA 노드에서 데이터에 액세스 한 횟수와 원격 노드에서 몇 번이나 액세스했는지 알려줍니다.

관련 문제