2017-04-12 3 views
4

This example은 tensorflow 프로그램을 프로파일하는 방법을 보여줍니다. 이 도구를 사용하여 간단한 LSTM 프로그램을 프로파일 링했습니다.텐서 흐름 프로파일 링 결과 이해

/gpu:0/stream:all Compute(pid 5)

MatMul_AllCompute

/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)

MatMul_GpuCompute

내 질문 :

가) 각 행의 의미는 무엇이며 그 결과는 주심의주의를 받았습니다.

b) 특히 /gpu:0/stream:all Compute(pid 5)/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)의 차이점은 무엇입니까?

c) 실행 시간이 다른 이유는 무엇입니까? 0.072ms0.094ms입니다.

답변

1

다음은 엔지니어 중 하나에서 업데이트입니다 :

'/ GPU : 0/스트림 : *'timelsines는 CUDA 커널 실행 시간의 하드웨어 추적합니다.

'/ GPU : 0'선이 CUDA 스트림의 OPS (일반적으로 거의 제로 시간 소요)을가 대기 상태 TF 소프트웨어 장치이다는

+0

따라서/GPU '의 개수 : 0'라인은 GPU 커널을 포함 발사 시간? – pgplus1628