저는 GPU에 대한 몇 가지 CUDA 가속화에 관한 프로젝트를 수행 중이며 일부 소프트웨어 레벨 최적화를 마쳤습니다. GPU 아키텍처의 일부 변경 사항은 프로젝트 최적화에 도움이 될 수도 있습니다.GPU 아키텍처 맞춤 설정?
이제 내 질문에 GPU 아키텍처에서 일부 기능이나 부품을 변경하는 효율적인 방법이나 존재하는 에뮬레이터가 있습니까? 그런 다음 성능 결과를 얻으려면 해당 맞춤형 아키텍처에서 CUDA PTX 코드를 벤치마킹 할 수 있습니다 정확한 사이클이되어야 하는가?) CPU의 아키텍처 시뮬레이터가 몇 가지 있습니다. 그래서 그 중 일부가 GPU를 지원하는지 궁금합니다. 아니면 GPU 에뮬레이터를 직접 작성해야 할 수도 있습니다^_ ^?