우리는 여러 노드에 대해 일반적인 nbody 알고리즘을 제공하려고합니다. 노드에는 2 개의 GPU와 1 개의 CPU가 있습니다.Openacc를 사용하여 GPU 클러스터에서 nbody 최적화
openacc를 사용하여 GPU에서만 n-body를 계산하려고합니다. openacc에 대한 연구를 한 후에 여러 GPU에 계산을 퍼뜨리는 방법을 확신 할 수 없습니다.
단 하나의 스레드와 openacc로 2 개의 GPU를 사용할 수 있습니까? 그렇지 않은 경우 OpenMP를 사용하여 하나의 노드에서 GPU 두 개를 모두 사용하고 MPI를 통해 다른 노드와 통신 할 수있는 적절한 승인이 무엇입니까?