저는 8 개의 NUMA 도메인을 가진 AMD abu-dhabi 아키텍처에서 다중 스레드 프로그램을 실행하고 있습니다. 나는 서로 다른 코어에서 쓰레드를 할당하고 다른 메모리 정책을 시도하기 위해 numactl을 사용하고있다. NUMA 도메인에 의해 정렬 된 캐쉬 미스/히트를 측정하고 싶지만 perf와 같은 도구를 사용하여 전체 카운터를 얻었습니다. numastat, likwid 및 hpctoolkit과 같은 도구를 이미 검토했습니다. NUMA 도메인으로 구분 된 표준 성능 카운터를 얻을 수있는 도구에 대해 알고 있습니까?Linux의 NUMA 노드가 캐시 미스/히트를 측정하는 도구는 무엇입니까?
1
A
답변
1
귀하의 필요에 따라 numastat가 충분하지 않습니까?
>numastat
node0 node1 node2 node3
numa_hit 2511148413 2668024472 2541805396 2631938751
numa_miss 687767 186973 510852 79546
numa_foreign 544853 1772504 1306738 1461626
interleave_hit 14268 14291 14281 14309
local_node 2509822983 2667700745 2541325673 2631417570
other_node 2013197 510700 990575 600727
node4 node5 node6 node7
numa_hit 2551615375 2287945142 2199394273 2506262343
numa_miss 1178554 1863536 2037710 1278384
numa_foreign 1709984 541463 241266 244888
interleave_hit 14287 14274 14291 14294
local_node 2551212630 2278515165 2198877939 2505436756
other_node 1581299 11293513 2554044 2103971
+0
안녕하세요. 답변 해 주셔서 감사합니다. Numastat는 어떤 노드가 페이지를 요청했는지 고려하지 않고 요청 된 페이지가 특정 노드에 있었는지 아닌지를 보여주기 때문에 충분한 정보를 제공하지 않습니다. 얼마나 많은 요청이 도메인 외부와 특정 노드를 만들었는지 알고 싶습니다. 내가 무슨 말하는지 이해 하겠니? – Jofe
0
Intel PCM 패키지에는 pcm-numa.x라는 도구가 있습니다. 각 코어가 로컬 NUMA 노드에서 데이터에 액세스 한 횟수와 원격 노드에서 몇 번이나 액세스했는지 알려줍니다.
관련 문제
- 1. Linux의 Numa 밸런터
- 2. HTTP 캐시 적중률을 측정하는 방법은 무엇입니까?
- 3. Django 캐시 성능을 측정하는 방법은 무엇입니까?
- 4. 리눅스에서 C 프로그램 캐시 히트/미스 및 CPU 시간을 측정하는 가장 간단한 도구는 무엇입니까?
- 5. NUMA 확인 방법은 무엇입니까?
- 6. Windows에서 메모리 할당을 측정하는 데 유용한 도구는 무엇입니까?
- 7. 캐시 블록의 크기를 측정하는 C 프로그램을 만듭니다.
- 8. Cassandra jconsole의 캐시 노드가 확장 가능하지 않습니다.
- 9. Linux에서 사용 가능한 메모리를 안정적으로 측정하는 방법은 무엇입니까?
- 10. install4j 명령 행 도구는 Linux의 32 비트 JVM에서 작동합니까?
- 11. 최고의 JavaScript 압축/난독 화 도구는 무엇입니까?
- 12. NUMA 시스템, 가상 페이지, 거짓 공유
- 13. 소프트웨어 캐시가 NUMA 시스템의 성능을 향상시켜야합니까?
- 14. MongoDB 및 NUMA
- 15. NUMA 아키텍처의 효율적인 사용
- 16. 다중 코어의 CPUID/NUMA
- 17. omp flush 및 cc-NUMA 아키텍처
- 18. .Net 앱이 단일 NUMA 노드 만 사용하는 이유는 무엇입니까?
- 19. 도구는
- 20. 메모리 사용량을 측정하는 방법
- 21. Linux의 ⇧ 키는 무엇입니까?
- 22. 메모리 Linux의 구멍이란 무엇입니까?
- 23. C 프로그램의 속도를 저하시키는 도구는 무엇입니까?
- 24. 엔터프라이즈 웹 기반 시스템의 "상태"를 측정하는 데 사용할 수있는 도구는 무엇입니까?
- 25. FireFox에서 브라우저 리플 로우를 측정하는 데 사용할 수있는 가장 좋은 도구는 무엇입니까?
- 26. 페이지 렌더링 속도에 대한 개별 CSS 규칙의 효과를 측정하는 도구는 무엇입니까?
- 27. APEX에서 사용할보고 도구는 무엇입니까?
- 28. XAML을 최적화하는 도구는 무엇입니까?
- 29. 구문 검사를위한 도구는 무엇입니까?
- 30. 가르치는 빌드 도구는 무엇입니까?
perf 통계에 --per-socket 매개 변수를 사용하면 카운터를 가져올 수있었습니다. AMD 아키텍처에서는 소켓 당 2 개의 NUMA 노드가 있기 때문에 정확히 원하는 것은 아니지만. – Jofe