流处理器单元是统一架构GPU内通用标量着色器的称谓。流处理单元直接影响处理能力,因为流处理单元是显卡的核心。流处理单元个数越多则处理能力越强,一般成正比关系,但这仅限于NVIDIA自家的核心或者AMD自家的核心比较范畴。NVIDIA和AMD的流处理单元比较不可采取近似比较,实际上AMD的应该叫流处理器单元,它每5个单元配一个数据收发的,这才是一个完整的流处理器,这样算一个流处理器。而NVIDIA1个流处理单元却只有1个单元。这是A卡与N卡的构造区别。形象点说,这个流处理单元相当于神经元,神经元越多大脑越发达,流处理单元越多显卡处理性能也就越强。
分类
在进入统一渲染架构时代后,提高Shader运行频率与效率是NVIDIA主导的设计思路,而AMD则维持庞大的流处理器数量。两种思路各有优劣。/n1、N的优势和A的劣势/nN卡的GPU中每个流处理器都具有完整的ALU(算术逻辑单元)功能,在发出一条操作指令时每个流处理器都能充分工作。而A卡的GPU中每个流处理器的5个流处理单元都是固定的,不能拆开重组,如果在处理纯4D指令的时候,每个流处理器只能处理一条4D指令,有一个流处理器单元闲置,但却无法加入其他组合来共同工作。/n简单地说,一个指令任务派发下来的时候,N卡的GPU是需要1个“人”独立工作即可完成。而A卡的GPU则需要5个“人”。结组工作才能完成ATI的人数虽然多,但这5个“人”中有可能会有4个“人”闲置,因为这4个“人”不具有独立完整的ALU功能,不能执行函数运算,浮点运算和Multipy运算。/n2、N的劣势和A的优势/nATI的设计也有其显著的特点——浮点运算能力强大。也就是说如果单纯比拼显示核心在浮点运算上的能力的话,可能ATI则要强一些,在GPGPU(通用图形处理器)项目应用比较多的科学计算方面,理论上能适应GPU和CPU融合的趋势。/n3、结论/n开篇提到的,因为N卡的一个流处理器等于五个A卡的流处理单元,也即HD5970的3200个流处理单元相当于640(3200/5)个流处理器。
详细定义
AMD-ATI显卡(以下简称A卡)和NVIDIA(以下简称N卡)在流处理器数量上的巨大差异给许多读者造成巨大的困惑。其实,这个情况和不同厂商、相当于CPU的二级缓存数量存在差异情况类似,简单来说就是“不同架构的GPU,流处理器的作用不尽相同,不能直接比较数量。”深入的解释请看下文说明。/n
AMD马上就会官方展示下一代显卡,但各种泄露已经拦不住了。除了疑似性能、照片,我们还了解到了Hawaii GPU的更多规格参数,尤其是最关键的流处理器数量,可以说相当意外。早在微软推出的DirectX 7当中就曾经提出过一个概念——T&L(中文名称是坐标转换和光源),它可以看做是流处理器的鼻祖,随着显卡核心芯片技术的发展,在DirectX 8中。由微软首次提出了Shader的概念。并且将Shader分为Vertex Shader(顶点着色器,又称VS单元)和Pixel Shader(像素着色器,又称PS单元)。
该文章由作者:【李鸿基】发布,本站仅提供存储、如有版权、错误、违法等相关信息请联系,本站会在1个工作日内进行整改,谢谢!