最全GPU技术架构常识

一塌胡涂 发表于 2024-7-15 17:59

GPU的发源

GPU缩写为Graphics Processing Unit的，一般称为视觉措置单元。
GPU被广泛用于嵌入式系统、移动电话、个人电脑、工作站和电子游戏解决方案傍边。
现代的GPU对图像和图形措置是十分高效率的，这是因为GPU被设计为很高的并行架构这样使得比通用措置器CPU在大的数据块并行措置算法上更具有优势。
1985年 8月20日 ATi公司成立，同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡，1992年 4月 ATi发布了 Mach32 图形卡集成了图形加速功能，1998年 4月 ATi被IDC评选为图形芯片工业的市场带领者，但那时候这种芯片还没有GPU的称号，很长的一段时间ATI都是把图形措置器称为VPU，直到AMD收购ATI之后其图形芯片才正式采用GPU的名字。
NVIDIA公司在1999年发布GeForce 256图形措置芯片时首先提出GPU的概念。
从此NVIDIA显卡的芯片就用这个新名字GPU来称号。GPU使显卡削减了对CPU的依赖，并执行部门原本CPU的工作，尤其是在3D图形措置时。
GPU所采用的核心技术有钢体T&L、立方环境材质贴图与顶点混合、纹理压缩及凹凸映射贴图、双重纹理四像素256位衬着引擎等，而硬体T&L技术能够说是GPU的标识表记标帜。
关于GPU必需知道的基本常识

图形措置单元（或简称GPU）会负责措置从PC内部传送到所连接显示器的所有内容，无论你在玩游戏、编纂视频或只是盯着桌面的壁纸，所有显示器中显示的图像都是由GPU进行衬着的。
对普通用户来说，实际上不需要独立显卡就可以向显示器「提供」内容。像笔记本电脑或平板用户，凡是CPU芯片城市集成GPU内核，也就是大师熟称的「核显」，这样就可以为对显示要求不高的低功耗设备提供更好的性价比。
正因如此，部门笔记本电脑、平板电脑和某些PC用户来说，要想将其图形措置器升级到更高级别也很困难，甚至不太可能。
这就会导致游戏（和视频编纂等）性能不佳，只能将图形质量设置降低才能工作。对此类用户而言，只有在主板撑持和空闲空间足够的情况下，添加新显卡才能够把（游戏）显示体验提高到一个新的程度。
GPU工作流程

GPU目前已成为PC内部最强大的组件之一，其性能大部门都来自于VRAM。由于独立显卡使用的显示内存独立于计算机内存，这些存储器模块允许快速存储和接收数据，而不必再通过CPU路由到主板上插的内存。
虽然显卡内存与计算机内存相似，但却完全分歧，例如：撑持DDR4内存的主板也可能会撑持GDDR5 RAM的显卡。显卡上的VRAM用于在卡上快速存储和访谒数据，以及为显示器缓冲衬着帧。其还有助于降低影响屏幕上近似数据的「锯齿状边缘」以实现抗锯齿，使图像看起来更平滑。
顶点措置：这阶段GPU读取描述3D图形外不雅观的顶点数据并按照顶点数据确定3D图形的形状及位置关系，成立起3D图形的骨架。在撑持DX8和DX9规格的GPU中，这些工作由硬件实现的VertexShader（定点着色器）完成。
光栅化计算：显示器实际显示的图像是由像素组成的，我们需要将上面生成的图形上的点和线通过必然的算法转换到相应的像素点。把一个矢量图形转换为一系列像素点的过程就称为光栅化。例如，一条数学暗示的斜线段，最终被转化成阶梯状的持续像素点。
纹理帖图：顶点单元生成的多边形只构成了3D物体的轮廓，而纹理映射（texturemapping）工作完成对多变形概况的帖图，通俗的说，就是将多边形的概况贴上相应的图片，从而生成“真实”的图形。TMU（Texturemapping unit）便是用来完成此项工作。
像素措置：这阶段（在对每个像素进行光栅化措置期间）GPU完成对像素的计算和措置，从而确定每个像素的最终属性。在撑持DX8和DX9规格的GPU中，这些工作由硬件实现的Pixel Shader（像素着色器）完成最终输出，由ROP（光栅化引擎）最终完成像素的输出，1帧衬着完毕后，被送到显存帧缓冲区。

GPU散热
要操作好GPU的原始设计效能必需有大量供电，大量用电就意味着大量发烧。显卡（或措置器）发生的热量是以热设计功耗（或简称TDP）和瓦特为单元测量的。但商家对产物的标称并不是直接所需的功耗值，例如新的GTX 1080标称为180W TDP等级，但这并不意味着它需要180W的功率。
之所以提醒大师关心这个值是因为，具有较高TDP的GPU用到有限空气流动的紧凑空间中可能会导致散热问题。出格是对GPU超频的用户来说，需要有足够的冷却手段来措置增加的热量，才能让其不变运行。
GPU术语
架构：GPU基于的平台（或技术）。一般由GPU厂商进行定义，如AMD 的Polaris架构。
显存带宽：它决定了GPU如何有效地操作可用的VRAM。显卡可以使用GDDR5内存，但如果没有有效地操作带宽仍然会有瓶颈。
纹理填充率：指GPU在单元时间内所能措置的纹理贴图的数量，单元是MTexels/S，由内核时钟乘以可用纹理映射单元（TMU）确定。
内核/措置器：显卡上可用的并行内核（或措置器）数。
核心时钟：与CPU的时钟速率类似，凡是该值越高GPU则能够更快地工作。
SLI/CrossFire：SLI和CrossFire分袂是Nvidia和AMD使用的技术，它们允许用户安装多块GPU卡并协同工作。
显卡解决图形问题和其他任务的众多核心都是专门设计的，强大的显卡和GPU可以为游戏提供更高的保真度和分辩率，虽然它比CPU更强大，但实际只能用于特定的应用法式。

页: [1]

Unity开发者联盟's Archiver

最全GPU技术架构常识