sud를 통해 원격 클러스터에서 cuda-gdb 디버그 코드를 사용하려고합니다. 이 노드에서 6 테슬라 C2070 GPU의 위치 :cuda-gdb에서 사용 가능한 장치를 볼 수 없습니다.
$ deviceQuery | grep "^Device"
Device 0: "Tesla C2070"
Device 1: "Tesla C2070"
Device 2: "Tesla C2070"
Device 3: "Tesla C2070"
Device 4: "Tesla C2070"
Device 5: "Tesla C2070"
을하지만 CUDA-GDB에서 코드를 실행하면, 그것은 여전히 나에게 오류 코드 = 24 제공 : "치명적인를 모든 CUDA 장치는 디스플레이에 사용되는 및 수 없습니다 디버깅 중에 사용하십시오. "
이미 -gencode arch=compute_20,code=sm_20
으로 설정하고 잘 컴파일했습니다. 디버거에 info cuda devices
을 입력하면 No CUDA devices
이 나옵니다. 나는 또한 CUDA_VISIBLE_DEVICES="0,2"
내보내기를 시도했지만 여전히 작동하지 않습니다. 어떻게해야합니까? 나는 cuda 5.0을 사용하고 있습니다. 미리 감사드립니다.
원격 클러스터 노드에서 X가 실행 중입니까? –
$ ps -e | grep X 결과는 00:00:16 Xorg입니다. 하지만 그것은 단지 보이는 gpu를 1 씩 줄여서는 안됩니까? – Stone
'/ etc/X11/xorg.conf' 파일의 설정 방법에 달려 있습니다. X 서버는 모든 GPU에서 시작하도록 구성 할 수 있습니다. –