Halide 언어로 작성된 코드에 성능 카운터가 있습니까? 내 코드로 얼마나 많은로드, 저장 및 ALU 연산이 수행되는지 알고 싶습니다.Halide 성능 카운터?
다단식 파이프 라인을 예약하기위한 Halide 튜토리얼은 할당 된 메모리,로드, 저장 및 호출량을 halide Funcs와 비교하여 다른 스케줄을 비교하지만이 정보가 수집 된 방법을 알지 못합니다. 이 작업 중 하나가 발생할 때마다 trace_stores, trace_loads 및 trace_realizations를 사용하여 콘솔에 인쇄하는 것이 가능할 수도 있습니다. 이것은 프로그램의 실행을 크게 늦추고로드, 저장 및 ALU 작업에 필요한 콘솔 출력의 긴 목록을 컴파일하는 일종의 카운팅 스크립트가 필요하기 때문에 좋은 옵션은 아닙니다.