流处理器单元是统一架构GPU内通用标量着色器的称谓。流处理单元直接影响处理能力，因为流处理单元是显卡的核心。流处理单元个数越多则处理能力越强，一般成正比关系，但这仅限于NVIDIA自家的核心或者AMD自家的核心比较范畴。NVIDIA和AMD的流处理单元比较不可采取近似比较，实际上AMD的应该叫流处理器单元，它每5个单元配一个数据收发的，这才是一个完整的流处理器，这样算一个流处理器。而NVIDIA1个流处理单元却只有1个单元。这是A卡与N卡的构造区别。形象点说，这个流处理单元相当于神经元，神经元越多大脑越发达，流处理单元越多显卡处理性能也就越强。

分类

在进入统一渲染架构时代后，提高Shader运行频率与效率是NVIDIA主导的设计思路，而AMD则维持庞大的流处理器数量。两种思路各有优劣。/n1、N的优势和A的劣势/nN卡的GPU中每个流处理器都具有完整的ALU（算术逻辑单元）功能，在发出一条操作指令时每个流处理器都能充分工作。而A卡的GPU中每个流处理器的5个流处理单元都是固定的，不能拆开重组，如果在处理纯4D指令的时候，每个流处理器只能处理一条4D指令，有一个流处理器单元闲置，但却无法加入其他组合来共同工作。/n简单地说，一个指令任务派发下来的时候，N卡的GPU是需要1个“人”独立工作即可完成。而A卡的GPU则需要5个“人”。结组工作才能完成ATI的人数虽然多，但这5个“人”中有可能会有4个“人”闲置，因为这4个“人”不具有独立完整的ALU功能，不能执行函数运算，浮点运算和Multipy运算。/n2、N的劣势和A的优势/nATI的设计也有其显著的特点——浮点运算能力强大。也就是说如果单纯比拼显示核心在浮点运算上的能力的话，可能ATI则要强一些，在GPGPU（通用图形处理器）项目应用比较多的科学计算方面，理论上能适应GPU和CPU融合的趋势。/n3、结论/n开篇提到的，因为N卡的一个流处理器等于五个A卡的流处理单元，也即HD5970的3200个流处理单元相当于640（3200/5）个流处理器。

详细定义

AMD-ATI显卡（以下简称A卡）和NVIDIA（以下简称N卡）在流处理器数量上的巨大差异给许多读者造成巨大的困惑。其实，这个情况和不同厂商、相当于CPU的二级缓存数量存在差异情况类似，简单来说就是“不同架构的GPU，流处理器的作用不尽相同，不能直接比较数量。”深入的解释请看下文说明。/n

AMD马上就会官方展示下一代显卡，但各种泄露已经拦不住了。除了疑似性能、照片，我们还了解到了Hawaii GPU的更多规格参数，尤其是最关键的流处理器数量，可以说相当意外。早在微软推出的DirectX 7当中就曾经提出过一个概念——T&L（中文名称是坐标转换和光源），它可以看做是流处理器的鼻祖，随着显卡核心芯片技术的发展，在DirectX 8中。由微软首次提出了Shader的概念。并且将Shader分为Vertex Shader（顶点着色器，又称VS单元）和Pixel Shader（像素着色器，又称PS单元）。

该文章由作者：【李鸿基】发布，本站仅提供存储、如有版权、错误、违法等相关信息请联系，本站会在1个工作日内进行整改，谢谢！

流处理器数量(GPU内通用标量着色器)

分类

详细定义

发表回复

流处理器数量(GPU内通用标量着色器)

分类

详细定义

相关推荐

发表回复