나는 CUDA로 놀고있다.CUDA에서 다중 스레드로 장치 변수 사용
현재 문제가 있습니다. 특정 응답에 대해 큰 배열을 테스트 중이며 응답을 받으면 다른 배열에 데이터를 복사해야합니다.
[V1] V2 :
가 [] [] [V1] [] [] [V2]
결과는 다음과 같이 표시한다 : 예를 들어
5 개, 소자 내 테스트 배열은 다음과 같다 ]
문제점은 결과를 저장할 두 번째 배열의 주소를 어떻게 계산합니까? 첫 번째 배열의 모든 요소는 병렬로 검사됩니다.
나는 장치 변수를 선언 할 생각하고는 는 요지 = 0 내가 응답을 찾을 때마다, 나는 요지을 증가합니다 int로. 하지만 그 이유는 확실하지 않습니다. addr에 동시에 액세스 할 수 있습니다. 그게 문제를 일으킬까요? 아니면 스레드가 다른 스레드가 해당 변수를 사용하여 끝날 때까지 기다릴 것인가?