Open CL의 시동기로서 GPU 컴퓨팅을 최적화하기위한 간단한 이해가 있습니다.OPEN CL, Python and parallelisation
내가 이해할 수있는 한, 즉, 1000x1000의 행렬을 만들 수 있으며 동시에 GPU를 사용하여 각 픽셀에 하나의 코드를 넣을 수 있습니다. 무엇 다음 옵션에 대해 : I는 100 × 100 매트릭스 100 번을 가지고 다르게 계산해야
. 그래서
시리얼을 실행해야합니다. 즉, 100 개의 인스턴스를 시작할 수 있습니다. 즉, 100 개의 파이썬 다중 프로세스를 시작하고 각 은 GPU에 매트릭스 계산을합니다 (충분한 리소스가 있다고 가정).다른 방법으로 라운드, 나는 을 계산하기 위해 1000 X 1000 및 100 개의 다른 인스턴스를 하나 가지고 있는데, 같은 시간 또는 직렬 처리로이 작업을 수행 할 수 있습니까?
어떤 조언이나이 가장 빠른 방법을 해결하는 방법 개념은
감사합니다. –