2012-02-28 4 views
0

나는 특별한 문제가있다.batchedgemm 소스 코드?

나는 MacBook에서 CUDA 4.1을 사용하여 개발 한 연구 코드가 있으며, 특히 batchedgemm을 사용하고 있습니다. 이제 다른 대학에서 대출 한 gpu 클러스터에서 실행해야합니다.

내 문제는 클러스터에 CUDA 4.0 만 설치되어 있고 빠르게 업그레이드하는 것을 꺼려한다는 것입니다.

어딘가에 batchedgemm 소스를 가져 와서 4.0 이하에서 컴파일 할 수 있다면 누구에게 알려주고 있습니까?

일괄 처리 곱셈을 수행하기 위해 자체 커널을 작성했지만 라이브러리보다 느린 약 10 배 정도를 수행합니다. 대신 발가락 대신에 위대한 남성의 어깨에 서고 싶습니다.

답변

2

프로덕션 클러스터를 신속하게 업그레이드하기를 꺼리고 있습니다. 많은 클러스터는 여러 버전의 CUDA 툴킷이 공존 할 수 있다는 것을 의미하는 모듈 시스템을 사용합니다. 그러나 드라이버는 사용중인 최신 CUDA를 지원하는 버전으로 업그레이드해야합니다. 이것이 회귀 또는 실패를 피하기 위해 사용자의 생산 코드 및 응용 프로그램을 테스트해야하기 때문에 꺼리는 이유입니다.

CUBLAS는 오픈 소스가 아니기 때문에 별도의 컴퓨터에서 코드를 개발하고 배치 작업에서 큰 속도를 얻으 려한다면 관리자에게 업그레이드 이유로 제시하십시오.