This example은 tensorflow 프로그램을 프로파일하는 방법을 보여줍니다. 이 도구를 사용하여 간단한 LSTM 프로그램을 프로파일 링했습니다.텐서 흐름 프로파일 링 결과 이해
/gpu:0/stream:all Compute(pid 5)
/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)
내 질문 :
가) 각 행의 의미는 무엇이며 그 결과는 주심의주의를 받았습니다.
b) 특히 /gpu:0/stream:all Compute(pid 5)
과 /job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)
의 차이점은 무엇입니까?
c) 실행 시간이 다른 이유는 무엇입니까? 0.072ms
및 0.094ms
입니다.
따라서/GPU '의 개수 : 0'라인은 GPU 커널을 포함 발사 시간? – pgplus1628