필자는 Finite Element discretization에서 스파 스 매트릭스를 어셈블하기 위해 OpenCL 코드를 작성하고 있으며 커널 코드에서이 매트릭스를 어셈블하는 데 사용할 수있는 영리한 구조와 관련하여 팁을 주시면 감사하겠습니다! 커널에서 임의의 행렬 위치에 액세스해야합니다.커널에서 OpenCL 스파 스 매트릭스 액세스
0
A
답변
0
큰 데이터 세트에 무작위로 액세스하면 GPU에 과세됩니다. 이 아니라면 모든 커널이 하나의 마스터 테이블에 무작위로 쓸 수 있습니다. 그러면 직렬 CPU보다 성능이 저하 될 수 있습니다.
대신, 나는 각 커널에 작업 할 메모리 덩어리를 줄 것이다. 어쩌면 각각은 (행, 열, 값) 튜플로 작은 좌표 목록을 사용하여 행렬의 일부를 어셈블해야합니다. 각 커널은 행렬 데이터를 어셈블 할 때 자신의 메모리 덩어리에서 작동해야합니다. 그런 다음 데이터를 다시 CPU로 가져 와서 정렬하고보다 효율적인 형식으로 재구성합니다.
정렬 된 행렬 데이터에 대한 추가 작업이 필요한 경우 두 번째 커널을 만드는 것이 가장 좋습니다. 커널은 간단한 작업에서 가장 잘 실행됩니다.
관련 문제
- 1. Cluto 스파 스 매트릭스 클러스터링
- 2. 스파 스 매트릭스 라이브러리가 필요합니다.
- 3. C에서 스파 스 매트릭스 변환
- 4. 자바의 스파 스 매트릭스 곱셈
- 5. 스파 스 매트릭스 svd에서 파이썬
- 6. scipy 스파 스 매트릭스 인덱스
- 7. GPU 또는 CPU의 스파 스 매트릭스 곱셈?
- 8. 스파 스 매트릭스 구현 및 Java에서의 작업
- 9. 스파 스 매트릭스 메모리 요구 사항 향상
- 10. R을위한 성숙한 스파 스 매트릭스 패키지는 대부분?
- 11. 스파 스 매트릭스 생성을 병렬로 수행
- 12. OpenCL, GPU 커널에서 호스트 메모리에 직접 액세스
- 13. 다른 OpenCL 커널에서 OpenCL 커널 호출
- 14. 스파 스 매트릭스 패턴에 대한 스키 핑 경계 조건
- 15. Simulink/xPC에서 스파 스 매트릭스 - 벡터 곱셈을 사용할 수 있습니까?
- 16. HDF5 (PyTables)에 numpy 스파 스 매트릭스 저장
- 17. C#에서 스토리지 최적화 스파 스 매트릭스 구현이 있습니까?
- 18. 스파 스 매트릭스 용 Fortran 90/95 라이브러리?
- 19. 스파 스 매트릭스 선형 및 비선형 방정식 솔버
- 20. matlab에서 매트 파일에 스파 스 매트릭스 저장 방법
- 21. opencl 매트릭스 라이브러리
- 22. OpenCL 커널에서 __constant qualifer 사용
- 23. OpenCL 커널에서 get_global_id 확인 필요?
- 24. Scipy 스파 스 dia_matrix 솔버
- 25. 포트란 : 스파 스 배열이나리스트
- 26. Oracle의 스파 스 열
- 27. 파이썬에서 스파 스 코딩
- 28. Scipy 스파 스 매트릭스의 주소 지정 범위
- 29. scipy의 액세스 값, 열 인덱스 및 row_ptr 데이터 CSR 스파 스 매트릭스
- 30. R에서 명명 된 행을 사용할 때 스파 스 매트릭스 열을 다른 스파 스 매트릭스에 추가 (연결) 할 수 있습니까?
필자는 유한 요소 이산화에별로 관심이 없지만 GPGPU.org [http://gpgpu.org/index.php?s=sparse%20matrix&searchbutton=Search]에는 스파 스 행렬에 관한 많은 기사가 포함되어 있습니다. –