나는 호스트에서 실행중인 시뮬레이션 작업을하고 계산을 위해 GPU를 사용하고 있습니다. 계산이 완료되면 호스트는 장치의 메모리를 자체로 복사 한 다음 계산 된 데이터를 먼 호스트로 보냅니다.cudaMemcpy 장치를 먼 호스트에
기본적으로 데이터를 수행합니다 GPU -> 호스트 -> 네트워크 카드
시뮬레이션을 실시간으로하기 때문에 시간이 매우 중요하다, 나는 그런 일하고 싶은 : GPU -> NETWORKCARD을, 데이터 전송 지연을 줄이기 위해
가능합니까? 아니요, 언젠가 우리가 볼 수있는 무언가입니까?
편집 : 먼 호스트에 => CPU
정확히 [GPUDirect] (https://developer.nvidia.com/gpudirect)와 관련 있습니다. – tera