安徽中徽豫实业有限公司:英伟达的诞生
2012年,谷歌的华人工程师、机器学习范围里的元老级人物、人称“机器学习之父”的吴恩达率领着“谷歌大脑”团队执行了一次“出格步履”——他们用1000台计算机,16000枚CPU芯片搭建了一个“猫脸识别系统”——通过喂给AI数百万张猫脸照片,教会AI识别猫咪。
最后,他们成功地让AI从1000万张照片里识别出了一张猫咪的照片。在当时,这个步履的成功在整个业界掀起了一次超级大地震。
无独有偶,也是在2012年,由斯坦福大学的李飞飞传授主办的ImageNet比赛上,一位名叫AlexKrizhevsky的科学家也因在图像识别上的优秀表示而获得冠军。
这本身并不是一个什么令人瞩目的新闻,但事件背后的东西才令人诧异:谷歌当年也奥秘参加了那场比赛,拿着不异的“考题”在私底下做了同样的测试。只不外,比赛成果发布后,谷歌震惊了:比起Alex团队的识别精度,本身的精度差了一大截。
作为科技龙头公司,谷歌明明拥有海量的资源、金钱和高端设备,却输给了一个学术小团队。要知道,Alex的团队一共就三个人,除了Alex本身,剩下两个分袂是他的同学Ilya和他们的指导老师Hinton。
就算Hinton是业内的顶级专家,也总不至于让谷歌输成这个样子吧?
后来发现,问题的关键在于硬件——这是GPU对CPU的一次碾压式胜利。
谷歌意识到这个问题之后,很快也部署了大量的GPU来作为算力资源。随后更是直接收编了Hinton、Alex和Ilya三人。
今天,提到人工智能就绕不外GPU,GPU俨然已经成为了AI时代的基础设施。而提到GPU,就绕不开一个名字——英伟达,一个诞生于1993年,从做游戏显卡起家的芯片巨头。
今天,我们就来聊聊英伟达和它的这些年。
“顽童”和创业
2017年10月23日,中国台湾省台北市,著名的芯片代工巨头台积电(TSMC)举办了成立30周年的庆典。全球半导体范围的重要人士几乎都在这个时候云集台北——当时的苹果首席运营官威廉姆斯,高通首席运营官莫伦科夫等人都出席了此次活动。
在一众西装革履的业界精英中,你会发现一个身材健壮,穿戴黑色皮衣和牛仔裤,和大师画风完全纷歧样的老哥。
这位皮衣老哥,就是人送绰号“硅谷刀王”,业内称为“顽童”的英伟达创始人兼CEO——“老黄”黄仁勋。
老黄1963年出生于台南的一个颇为体面的家庭里,父亲是一名化学工程师,母亲是一名小学老师。显而易见,这个出身,以后概略率是要当顶级做题家的。
就在老黄9岁的时候,家里人决定移民到美国。不外,在移民的过程中,遇到了一点点“小变故”。老黄爸妈暂时还去不了美国,老黄无奈求学于一个专门为了问题少年成立的寄宿学校。在这样一个环境下,老黄在还是“小黄”的时候就学会了抽烟和打架。
由此可见,老黄的“顽童”称号的确不是浪得虚名。
好在几年之后,老黄的爸妈终于也来到了美国,老黄终于能够分开“少管所”了。
进入正规学校之后的老黄不仅在学习长进步飞快,而且还成为了专业的乒乓球运带动——1978年,15岁的他就拿到了美国乒乓球公开赛的双打季军。
然后,老黄的故事便趋于平淡了——读了大学,选了电子专业,成为了一名工程师,随后就开始了在芯片行业的职业生涯,一直到1992年。
1992年底的某天——两个伴侣克里斯和普雷艾姆找到了老黄。他们邀请老黄插手他俩新创建的一个名为英伟达的小公司,而且但愿老黄能成为公司的总裁兼CEO——他们很欣赏老黄在技术和公司打点上的程度。
就这样,老黄从AMD离职,成为了英伟达的创始人兼CEO,直到今天。为什么老黄和此外两个伴侣要创办英伟达呢?原因很简单。
90年代初,家用电脑方才在美国普及没多久,对准家用电脑的游戏行业也才方才起步。不外,阿谁时代的电脑游戏功能很差,基本上只能玩一些横轴或者纵轴的简单游戏。局长小时候就曾经在老妈办公室里的286上玩过,画面效果的确不胜入目。
就是瞅准了这个市场空白——老黄他们决定出手解决电脑游戏的画面问题。
第一次图形革命:GPU的诞生
1993年,有一款游戏引爆了全球的电子游戏市场——由约翰·卡马克领衔创作的《Wolfstein3D》(德军总部3D)。这个游戏的牛逼之处就在于,在阿谁横轴纵轴小游戏占据主流的时代,这个游戏居然搞出了第一人称视角的射击游戏——玩家的视角可以通过移动鼠标而切换。
虽然当时《德军总部3D》的画面只能算是一种欺骗眼睛的“假3D”,但它的火爆和前所未有的娱乐性已经昭示着一个时代的到来:未来游戏的大标的目的,必然是3D!
但问题是,当时的电脑未必能扛起游戏开发商的美梦。3D游戏的呈现,意味着计算机不仅要措置二维的画面,还需要承担起措置三维立体对象的任务。在当时来说,这是一个非常消耗算力的任务。
笼统来说,整个过程分成了五个法式:顶点措置,图元措置,栅格化、片段措置和像素操作——首先把模型的三维坐标转化成二维的(顶点措置),再把这些零散的坐标点连接成多边形(图元措置),再把一个个多边形变成像素点便利上色(栅格化),然后再给像素点上色从而实现各种色彩光泽(片段措置),最后优化一下,剔除那些我们看不见的处所(比如一个立方体背后看不到的那几个面)。
这就是所谓的“图形流水线”,很多文章在介绍GPU的时候城市提到的“管线”(Pipeline)就是这个东西。
在现实里,这就意味着无数次运算——以90年代电脑的分辩率来看,用一个640X480的显示器全屏玩游戏,屏幕上包含了30万个像素点,按照60fps的帧率,每秒钟需要衬着1800万次。每个像素点又都要颠末栅格化、片段措置和像素措置三个法式,那么为了
一秒钟的画面,我们最少最少也需要5400万条指令。
或者换一种说法,在一秒钟内,计算机需要完成54M条运算指令。而当时的英特尔CPU的主频有多少呢?60MHz,即每秒运算6000万次——如果用当时的CPU来措置3D图形,整个CPU的算力城市被消耗殆尽——由此可见,对当时的电脑来说,3D游戏就是一个“超级算力杀手”。
率先给出解决方案的不是英伟达,而是一个名叫3dfx的公司。他们给出的解决方案非常简单粗暴——既然措置3D对象非常消耗算力,那么我就专门搞一个硬件来帮CPU做这方面的工作吧。
于是,3dfx公司的Voodoo(巫毒)加速卡便登上了历史舞台。1995年11月6日,Voodoo上市发售,瞬间便成为超级爆款,一时间市场占有率高达85%,直到1997年,Voodoo在中国市场上也是一个“一卡难求”的状态。
看到Voodoo的成功,各路人马一拥而上,美国市场上瞬间呈现了上百家做显卡的公司。整个行业立刻卷到不行。
老黄他们当时不仅在研发本身的显卡产物,也在研究本身的API(应用法式界面,一种对应显卡专门化的开发东西,可以便利开发人员的工作)。
但好巧不巧,微软此时也推出了本身的开发东西DirectX。
这么一来,老黄他们就很尴尬了,因为微软的超然地位,所以绝大大都厂商必然会选择适配兼容微软的DirectX,而如果老黄他们对峙用本身的开发东西,成果必然是成为孤家寡人。
老黄他们没法子,只能一咬牙一跺脚,投入了微软的怀抱。不久,英伟达就推出了本身的显卡产物——RIVA128。这款产物从性能来说还是不如Voodoo,但这款产物却让老黄他们赌上了本身的全部。
最终凭借着精准的市场定位,RIVA128依旧成功了。
虽然RIVA128性能不如Voodoo,但是RIVA128好就好在它既可以措置3D,也可以措置2D。更重要的是,Voodoo在当时犯了一个近乎于致命的错误——他们也在死死对峙本身的开发东西GlideAPI,拒绝使用主流的OpenGL和DirectX——成果就是几年之后,随着各路游戏开发商投入了OpenGL和DirectX的怀抱,Voodoo系列彻底落伍。
而RIVA128则分歧,RIVA128对OpenGL的兼容做得非常好,在那些不用GlideAPI开发的游戏里的表示吊打Voodoo,获得了玩家的高度承认。
随后,英伟达便否极泰来了——接连着两款代号为TNT的产物都像炸药一样让整个游戏行业震动了起来。而与此同时,3dfx却在一路沉沦,Voodoo3上市的时候,其性能已经完全没法子形成显著的市场优势。
到了1999年,这场关于显卡的裁减赛终于走到了尽头——英伟达推出了GeForce256——一款从硬件层面上撑持T&L(转换与照明)的新产物。
为什么硬件T&L如此重要呢?这就要从游戏画面的进化说起了。
之所以我们感觉早期的游戏画面很假,一是因为建模粗拙,二是因为没有良好的光影效果,三是不能实现全标的目的的视角变换——从今天的视角来看,《DOOM》和《雷神之锤》时代的游戏,游戏里的角色只能说是“初具人形”,光影效果也只能说是“聊胜于无”,视角也只能是从主角的眼睛往外看。
不是游戏厂商不思朝上进步,而是真的没法子:精致的建模意味着更多的多边形,更好的光影效果意味着需要计算光照,更多的角度意味着计算机可以进行三维空间坐标系的变换——而在当时,这些事情都还是需要用CPU来计算的。
这就是为什么包罗Voodoo在内的产物只能叫“加速卡”而不是“显卡”——因为五个法式里,它们只负责从图元措置或栅格化开始的那么三四个法式,最开始的顶点变换任务始终都是由CPU来完成的——建模越精致,顶点就越多,CPU的承担就越大。
GeForce256的创新之处就在于它从硬件上接管了CPU的转换和光照计算,彻底解放了CPU。
至此,世界上第一款现代意义上的GPU诞生了。
而此时,英伟达的最大对手、开发了Voodoo卡的3dfx却已经迎来了本身的终局——硬件市场上,Voodoo被英伟达步步紧逼,软件范围,3dfx的GlideAPI又在被OpenGL和DirectX围剿——南北对进,两面夹击,3fdx彻底凉凉,最终于2000年被英伟达以极低的价格收购。
踏着对手的尸体,英伟达奠基了本身在显卡这个硬件品类里的地位,成为了硅谷里一颗冉冉升起的新星。
复盘这段过程,我们会得到一个有意思的结论:如果没有游戏行业的进步,就不会发生强烈的画面需求,没有这种需求,也就不会催生出Voodoo和GeForce256这样的产物,也就不会诞生今天的英伟达。
毕竟,除了游戏行业,你很难发现有哪个行业对图形硬件有如此之高、如此之大的需求。事实上,在《雷神之锤》《DOOM》等游戏呈现之前,3D图形措置是电影、设计等行业里的专业问题,需求有限,头部玩家一只手都数得过来,所以也采购不了太多的产物,更何况,电影和设计行业都是“行业生意”,虽然也有硬件上的需求,但是采购回来的显卡都是作为出产资料的,更新迭代的频率斗劲慢。
《QUAKE》(高清重置版本)
而游戏玩家则分歧,显卡在游戏用户的眼中属于消费品,在早期几年就要换一台电脑,持久来看,这就形成了一种对显卡的持续的消吃力——众所周知,研发芯片是极其花钱的事情,如果只依靠电影、设计院之类的少量行业客户,那么显卡的定价必需异常昂扬才能收回成本,而当游戏行业蓬勃成长之后,整个池子瞬间扩大了无数倍,复杂的游戏玩家和消费电子市场让每一颗包罗GPU、CPU在内的芯片价格都大大降低——换句话说,游戏行业成了GPU厂商的最大投资人,促进了芯片的大规模成长。
游戏这股隐形的科技驱动力,在经历了如此多的市场验证后,终于在去年7月中科院发布的《游戏技术——数实融合进程中的技术新种群》陈述中被初度官方认证。陈述指出:“电子游戏突出的趣味属性掩盖了它的科学属性,所以游戏技术持久为人们所忽视;2020年,游戏技术对芯片财富的科技进步贡献率达到了14.9%”——由此,我们可以看出游戏作为一种产物的特殊属性:它的进步不仅依赖于技术的进步,也能反向促进技术的进步。
“皮衣刀客”和“核弹工厂”
英伟达的成功,除了早期精准的定位外,和老黄卓越的商业头脑也有着很强的关系。
在GeForce256大获成功之后,老黄开始修炼起了本身的独门刀法,为日后成为“硅谷一刀流”的大掌门奠基了基础。
所谓的“老黄刀法”,指的是英伟达神奇的定价策略。简而言之就是“一分代价一分货”——对产物的性能和价格有着极其精准的掌握,价格布局梯度合理,绝少呈现初级显卡性能反超高级显卡的事情——更直接点说吧,想花素菜的钱吃荤菜?门儿都没有。
对比起隔壁AMD产物经常通过技术手段让低端显卡超越高端显卡的事情,英伟达对产物价格的把控绝对是大师级的。
实际上,从之前我们提到的TNT开始,老黄的刀法便逐渐显露了出来。当年的TNT2推出的时候,一次性就出了4个版本:TNT2、TNT2M64、TNT2Pro、TNTUltra……预算不足的伴侣可以直接选择TNT2解决需求,土豪的伴侣可以直接选择TNTUltra来纵享丝滑。
成长到此刻,老黄的“刀法”越来越神了,两款分歧显卡之间的价格差异居然已经到了只有100-200元的差距,几乎是从字面意义上做到了“一分代价一分货”。
为什么要这样定价呢?一是两款分歧定位的显卡之间绝对不会呈现互相争抢用户的情况,每一个细分的用户群体都能找到本身适合的产物。二是能够更好地吸引消费者采办高档显卡——用两块分歧的英伟达显卡,玩同样设置的同一款游戏,价位每下降一个档次,游戏帧率就会差一小截,低端卡超频到冒烟也打不外正常阐扬的高端卡。
但偏偏两款价格就只差200块,所以消费者会下意识感觉——反正几千块钱都要花出去了,也不在乎这么200块钱了。
再来,我们说一说英伟达被称为“核弹工厂”的故事。
这里,我们需要了解一句业内的谚语——“What Andy gives, Bill takes aways”——Andy是英特尔CEO安迪·格鲁夫,Bill是微软的比尔·盖茨。这句谚语的意思是,硬件性能的大幅度提升所带来的广阔空间,很快就会被软件的成长消耗殆尽。早期游刃有余的表示到了后期则会显得捉襟见肘。事实上,很多大型电脑游戏,碍于硬件程度,玩家都不得不牺牲必然的画质,以保证游戏运行流畅。
这种现象在英伟达早期的产物上也有浮现,早年的GTX590显卡因为超频使用导致电路不胜重负、发烧严重,隔着机箱都能感到感染到灼热的温度,甚至呈现过直接烧毁的变乱。
于是乎,英伟达的产物被安上了一个“战术核弹”的称号。在一些网友的敦促下,这个称号传布的越来越广,甚至早年间被人编排进了百度百科。
然后,国内某电视台的节目主持人不幸中招,把网友恶搞的内容当真,在节目中一本正经地胡说八道——“一发690战术核显卡就能摧毁一个航母战斗群”。
呈现这些故事的底子原因还是硬件没有跟上软件的成长——按照摩尔定律,集成电路上的晶体管数量每隔18个月就会翻倍。在这个18个月里,硬件不会再继续成长,但软件却在不竭进步——说句夸张的话“想要榨干硬件的性能,有时候只需要一行代码。”
最典型的例子就是2007年的“显卡危机”——2007年发售的游戏《孤岛危机》的画面设定过于优秀,游戏建模极其精致,导致GPU需要衬着的多边形数量打破天际。更何况游戏的开发商Crytek当时为了炫技,大量使用了超越当时硬件程度的游戏引擎和显示技术——别说是2007年的显卡,即便是用2017年的显卡来运行这款游戏也是捉襟见肘。
由此可见,对比起硬件(芯片)的进步,软件(游戏)的进步要容易得多。
因此,GPU厂商必需要以更高的速度来成长本身的产物才能勉强跟上游戏的法式, GPU的成长应该比一般的芯片成长更快。实际上,英伟达GPU的更新频率是6个月——老黄一直想让本身的“黄氏定律”去代替“摩尔定律”。
从财政数据上,我们也能看出为什么GPU厂商在新品研发上如此激进:英伟达2022财年一季度总共的收入80多亿美元,里面有35亿美元都是游戏显卡业务贡献的。而英伟达的对家AMD的情况也差不多,2022年三季度56亿美元的收入里有16亿都来自游戏业务——对GPU厂商来说,如果不能及时推出新产物跟上新游戏的法式,等待他们的就是收入暴跌、被裁减出局的悲凉成果。
第二次图形革命:光追技术
在我看来,软件的快速成长倒逼着硬件升级的逻辑其实一直都是存在——逼着人们研制出加速卡和GPU的,不正是三十年前风靡一时的《DOOM》和《雷神之锤》么?
而今天硬件跟不上软件的显著案例,就是“光线追踪技术”(后简称“光追技术”)。
之前我们已经讲过了,从1993年到今天,传统的3D图形衬着技术基本都遵循着经典的5个法式,整个的一套思路就是将3D模型先转成多边形的面,然后再把面变成像素点,然后给每个像素点上色。
在今日这个算力大爆炸的时代,栅格化的这套模式对于实时生成图像非常有效,有了主流显卡的加持,即便是4K画质的游戏跑个60fps一点问题都没有。
独一的不足在于图像上的颜色和光影效果仍然距离真实差了一点——举例来说,在栅格化模式下,游戏里的水(水坑、湖泊)虽然也有传神的效果,但实际上这些水的颜色是变成像素点后此外上色的,并不会像真实的水面一样反射旁边的景物。
即便是通过某些技术手段(比如调节材质的反射率)让水体发生还不错的反射效果,但这种手段只能说是“治标不治本”——本质上还是“给像素点上色”。
但光追技术就纷歧样了,光追是治本的。
举个例子来说吧,在现实中,假设我们在一个玻璃桌面上摆一个红色陶瓷杯,当一束阳光照上去之后,陶瓷杯子朝向太阳的一面会形成闪亮的高光,背着太阳的一面则会形成暗影。除此之外,因为是玻璃桌面,杯子会形成倒影,桌面也会反射阳光照在杯子上……这一系列的光影变幻结合起来,就是我们肉眼所见的画面。
光追技术就是去模拟这个过程:直接模拟人眼看到的、光线的物理运动来生成高度传神的图像。
在这套方式的撑持下,我们足以模拟出无限趋近真实的震撼效果。
而辅佐光追技术落地的,依旧是游戏行业——逻辑和当年一样: 有且只有游戏行业,一头是耗资不菲的先进计算机图形技术,一头是数以亿计等着掏钱分摊研发成本的消费者。
最成功的转型
事实上,持久以来,游戏相关业务都是英伟达最重要的业务,没有之一。在AI时代到来之前,在阿谁算力还没有成为基础设施的年代,要问英伟达的知名度在哪个群体里最响亮,那也必然是游戏用户。
但正如乔布斯所说的“做软件的极致是做硬件”——反过来也一样,做硬件的到最后必然也是要去做软件的。
对乔布斯来说,这个硬件叫苹果。对黄仁勋来说,这个软件叫CUDA —— CUDA,由英伟达于2007年6月23日发行,全称是ComputeUnifiedDeviceArchitecture,中辞意思叫“计算统一设备架构”,它能够允许计算机里的软件使用GPU来进行通用措置——也就是所谓的GPGPU(Genera-purposecomputingonGPU,GPU上的通用计算)。
CPU就像是一个老专家,什么城市,但是精力有限,适合措置复杂问题(通用计算);GPU则像是一个年轻的学生,虽然会的不多,但脑子快、动作灵活,适合措置简单反复的问题(并行计算)。
当大哥黄第一次拿出GeForce256,开创GPU纪元的时候,GPU从CPU手里接管了转换和照明计算任务——这只能说是“分管了CPU的工作”。
但此刻,当GPGPU开始呈现,GPU已经开始抢CPU的活儿了——阿谁年轻的学生已经长大了,翅膀硬了,开始能够措置复杂问题了(通用计算)。
这一下,事情就有趣了:GPU的多核心系统可以有效地措置大块数据了——非论机器学习、物理引擎还是各种算法都能胜任。
于是,GPU也就成为了AI财富的宠儿——也就有了文章开头所说的各种AI竞赛中GPU碾压CPU的情况。
英伟达创业初期,为了保留下去,不得不放弃本身的开发东西,转而插手微软的DirectX,但我相信,在老黄心里,恐怕一直都有一个“自研开发东西”的梦——因为开发东西的背后,是尺度,是行业的端方——顺我者昌,逆我者亡。
今天,游戏及其衍生出的游戏技术和相关行业,已经成了全球科技行业里的重要板块。
以比来爆火的AI财富来说,按照本年游戏财富年会发布的一份行业调研显示,游戏行业与非游戏行业受访者都高度认同游戏对AI技术的敦促(81%)——时至今日,游戏行业的意义已经不成和十年前甚至几年前同日而语了。游戏行业的成长,垂垂成为了一种可以在大国博弈中阐扬影响力的变量。
事实上,除了AI,科研、工业等等范围都正在试图从游戏与游戏科技中吸取养分。
2017年,瑞士日内瓦大学的科学家MichelMayor和游戏《星战前夜(EVE)》开发商达成合作,Mayor请求《星战前夜(EVE)》的开发商在游戏中植入一系列的活动以辅佐他的研究——操作游戏世界里高度仿真的宇宙,让玩家在游戏中不雅察看、标识表记标帜系外行星的亮度以完成相应的任务。由于这个任务非常简单,普通玩家也可以掌握,且游戏主办方还提供了许多任务奖励,于是大量的游戏玩家参与进来,为Mayor的的研究贡献了大量数据,间接性地让MichelMayor站上了2019年诺贝尔物理学奖的领奖台。
同时,原本为了游戏效果、游戏画面而研究的游戏引擎因其强大的实时衬着、3D模型措置能力,正在被改造为工业范围的通用研发平台。
以虚幻引擎系列(Unreal)为例,虚幻引擎多年来深耕游戏行业,在许多3A游戏制作中验证了性能,提供了照片级真实度的可视化方案,且可以实现交互写作的功能。当年为了游戏开发而生的脚本系统、材质编纂器,此刻已经被用在了汽车行业,成为了汽车厂商的尺度数据模拟与可视化平台。
再回头看看今天全球超算500强之中,GPU提供了56%的总算力,在自动驾驶范围已经成为了不成或缺的重要零件,甚至已经成为了一种具有战略意义的产物,美国甚至已经开始要求英伟达对中国进行禁售。 然而,掰开了看,支撑GPU走到今天的,竟是游戏,这可能是很多人没有想到的。
页:
[1]