NVIDIA Fermi 아키텍처 (cuda의 doc 폴더에있는 Compute_profiler.txt 파일)의 성능 카운터 이름을 살펴보면 L2 캐시 실패의 경우 2 개의 성능 카운터 인 l2_subp0_read_sector_misses 및 l2_subp1_read_sector_misses. 그들은 L2의 두 조각을위한 것이라고 말했다.NVIDIA의 L2 캐시 Fermi
두 개의 L2 조각이있는 이유는 무엇입니까? 스트리밍 멀티 프로세서 아키텍처와 관련이 있습니까? 이 부문이 성과에 미치는 영향은 무엇입니까?
감사
나는 그 생각을 좋아한다. 이것이 확인되면 계속 볼 것입니다. – Zk1001