필자가 작업중인 일부 입자 시스템 눈 사탕의 속도를 높여야합니다. 눈 사탕은 첨가제 혼합, 축적 및 입자에 대한 자국과 노을을 포함합니다. 지금은 부동 소수점 이미지 버퍼로 손으로 렌더링하고 마지막 순간에 unsigned char로 변환 한 다음 OpenGL 텍스처로 업로드합니다. 광선을 시뮬레이트하기 위해 나는 다른 해상도와 다른 오프셋에서 같은 텍스처를 여러 번 렌더링합니다. 이것은 너무 느리다는 것을 증명하고 있으므로 뭔가를 바꾸려고합니다. 문제는 내 dev 하드웨어가 Intel GMA950이지만 대상 컴퓨터에 Nvidia GeForce 8800이 있기 때문에이 단계에서 OpenGL을 프로파일 링하는 것은 어렵습니다.그래픽 : 부동 소수점 집적 이미지가있는 최상의 성능
나는 매우 비과학적인 프로파일 링을 수행하여 대부분의 속도 저하가 float 이미지를 처리 할 때 발생한다는 것을 발견했습니다. 모든 픽셀을 페이드 아웃하기 위해 상수로 스케일링하고 float 이미지를 부호없는 chars로 변환하고 그래픽 하드웨어. 그래서, 최적화를 위해 다음과 같은 옵션을 찾고 있어요 :
- 가 SSE2 어셈블리를 사용하여 16.16 구성
- 최적화 플로트 작업 (이미지 버퍼가 수레의 1024 * 768 * 3 배열 고정 된 지점에서 UINT32 년대와 수레를 교체)
- 사용 OpenGL을 축적 버퍼 대신 float 배열
- 사용 OpenGL을의 부동 소수점 FBO의 대신 float 배열의
- 사용 OpenGL은 픽셀/버텍스 쉐이더
을 가지고 이러한 가능성을 가진 경험이 있습니까? 어떤 생각, 조언? 내가 생각하지 못한 다른 것?
스크린 샷을 볼 수있는 채널이 있습니까? – Peter