2009-10-06 3 views

답변

5

인텔 Intel Processor Software Developer Manuals의 칩 설명서를 살펴볼 수도 있습니다. 어셈블리 언어 코딩은 그리 재미있는 것은 아니며, 코드가 성능에 결정적인 중요한 경우를 제외하고는 일반적으로 불필요합니다.

SSE를 살펴볼 때, 그래픽 카드를 사용하여 사용자 정의 셰이더를 통해 CUDA를 조사하는 것이 더 효과적 일 수 있습니다. 그렇게하면 ASM을 배울 필요가 없으며 심각한 번호 정리를 수행하는 경우 병렬 처리가 잘되면 속도가 훨씬 빨라질 수 있습니다.

+0

경우에 따라 이미지 분석에서 비디오 카드로의 업로드 및 다운로드가 x86에서의 계산보다 느립니다. CUDA의 좋은 사례는 예를 들어 압축 된 형식으로 업로드하는 코덱은 비교적 무거운 계산을 수행하므로 결과 이미지 스트림을 메인 메모리로 다시 이동하지 않아도 비디오 출력이 가능합니다. –

+0

좋은 시험과 측정 ... 신청서를 모른 채로 나는 단순히 고양이를 피하는 방법이 하나 이상 있다는 것을 알려주고있었습니다. 나는 비록 PCIx 16 버스가 메모리 버스에서 심각한 처리량을 가지지 만 생각했을 것이다. 나는 Tesla 슈퍼 컴퓨터 노드가이를 염두에두고 설계되었다는 것을 알고있다. 64 레인 PCI 급 시스템에는 4 개의 CPU 프로세서가있다. – Spence

+0

CUDA는 독점적이며 제한된 용도로만 사용할 수 있습니다. – asdf

1

This은 시작하기 좋은 포럼입니다. 그것은 형태의 MASM이지만, 사람들은 당신이 필요로하는 것을 도울 수있을 것입니다.

0

그들은 인형 책을위한 어셈블리가 있습니까? 풍자적이지는 않지만, 보통 간단한 예제를 사용하여 단계별로 좋은 단계를 제공합니다.

0

시간이 많다면 Randall Hyde의 고전적인 자체 학습 도서 인 The Art of Assembly Language를 권합니다. ASM과 같은 언어를 사용하여 어셈블리를 수행하는 방법을 알려줍니다. 어쩌면 이미 숙련 된 전문가에게는 시간 낭비 같지만 학습을 시작하는 것이 좋습니다.

관련 문제