CPU 未来的发展方向是什么?
未来的方向只有两个:性能和效能。游戏,办公软件,生产力还是服务器领域,单核性能都非常重要,因此对IPC的追求是不会停下来的。去年zen3上市和今年12代酷睿上市都引发了抢购热潮。
效能,顾名思义,保证成本和节能的情况下提供充足的性能。我个人认为效能应该会更多的体现在多核性能上。
英特尔的大小核设计就指明了未来发展方向,四个小核心的规模仅仅相当于一个大核心,而且核心的功耗非常低,甚至可以同ARM这种传统的精简指令集媲美。
给12900K大约65W的功耗,其单核性能就足以吊锤250W功耗的11900K,多核性能也超过11900K大约5%。
AMD的主频调度也是解决方案之一,而且它提供了更强大的理论性能,但随着新工艺成本的攀升,AMD也不可避免的会采用大小核设计,这是当下的最优解。
下一步就是3D封装技术,CPU内部不同的模块对性能和稳定性的要求不一样,比如核显部分就需要高密度工艺,CPU部分需要高性能工艺,其他IP有的需要功耗,有的需要稳定,如果能混合使用,那将会彻底改变现有的格局。 未来的方向只有两个:性能和效能。
游戏,办公软件,生产力还是服务器领域,单核性能都非常重要,因此对IPC的追求是不会停下来的。去年zen3上市和今年12代酷睿上市都引发了抢购热潮。
效能,顾名思义,保证成本和节能的情况下提供充足的性能。我个人认为效能应该会更多的体现在多核性能上。
英特尔的大小核设计就指明了未来发展方向,四个小核心的规模仅仅相当于一个大核心,而且核心的功耗非常低,甚至可以同ARM这种传统的精简指令集媲美。
给12900K大约65W的功耗,其单核性能就足以吊锤250W功耗的11900K,多核性能也超过11900K大约5%。
AMD的主频调度也是解决方案之一,而且它提供了更强大的理论性能,但随着新工艺成本的攀升,AMD也不可避免的会采用大小核设计,这是当下的最优解。
下一步就是3D封装技术,CPU内部不同的模块对性能和稳定性的要求不一样,比如核显部分就需要高密度工艺,CPU部分需要高性能工艺,其他IP有的需要功耗,有的需要稳定,如果能混合使用,那将会彻底改变现有的格局。 之前很长一段时间内CPU都在堆核,但现在堆核也到了瓶颈。但CPU的发展不会停止,以下几个方面还有潜力可以挖掘:
工艺、架构(DSA、并行、缓存)、材料、异构、封装、Chiplet、SoC、AI(NPU)
从突破性的技术来看,有以下两个方面:
量子芯片、碳基芯片
<hr/>工艺
工艺依然是未来5-10年影响CPU性能的一个非常重要的方向。我在之前里的回答写过,虽然晶体管在10nm以下会出现短沟道效应和量子遂穿效应,但我们依然可以在晶体管12nmGate Length下实现等效2nm的单位晶体管密度。
工艺方面的现状是目前5nm已经实现量产,3nm已经在研发的路上了,目前主要是台积电和三星两家Foundry。
三星的3nm工艺会使用环绕栅极晶体管(GAA)技术,而不是现在的FinFET,新的技术可以让芯片面积减少35%,功耗下降约50%,与5nm FinFET工艺相比,同样功耗情况下性能提升33%。
三代晶体管的发展
GAA全能门与FinFET的不同之处在于,GAA设计围绕着通道的四个面周围有栅极,从而确保了减少漏电压并且改善了对通道的控制,这是缩小工艺节点时的基本步骤,使用更高效的晶体管设计,再加上更小的节点尺寸,和5nm FinFET工艺相比能实现更好的能耗比。
而台积电依然采用FinFET,预计2022年下半年台积电3nm工艺就会投产。苹果作为台积电最重要的客户,肯定会独占一段时间的产能,其他客户包括英特尔、赛灵思、英伟达、AMD等。
架构
架构是未来CPU除工艺外最重要的方向之一!架构对一个芯片的性能来说也是至关重要的。
相较于X86通用处理器的笨重指令集,DSA(Domain Specific Architecture)是一个非常重要的方向。DSA的优点在于,可以为特定的一类应用或者场景做架构优化,从而实现更好的能效比。相对于传统的通用处理器,DSA需要设计时考虑专用领域的特殊需求,也需要设计者能对该领域有深入的理解。DSA的例子包括为机器学习设计的神经网络处理器,以及为图像和虚拟现实设计的GPU,DSA设计将会成为处理器架构的新趋势。
当然,除了指令集外,多线程并行和缓存也很重要!以AMD的Zen架构举例,利益相关,所以放一点百度上有的。
Zen架构将以四个核心为一个群组,AMD将其称为“CPU Complex”(CCX)。
每一个CPU复合体内包含四个Zen CPU核心,但它们是彼此完全独立的,不像推土机架构那样,彼此不会共享任何单元。
处理器主要架构改进如下 :
·SMT多线程,每个核心可支持2个线程
·8MB L3缓存
·容量更大、更统一的L2缓存
·微操作缓存(Micro-op Cache)
·具备2个AES加密单元
·高能效FinFET工艺
“Zen”核心采用了最新缓存层次结构,并改进了分支预测和同步多线程技术 。这些先进设计将使“Zen”处理器核心极具弹性,以满足广泛的应用需求,其中包括无风扇2合1产品、嵌入式系统、高性能计算和数据中心。
材料
半导体行业经过近六十年的发展,半导体材料经历了三次明显的换代和发展。第一代半导体材料主要是指硅、锗元素等单质半导体材料;第二代半导体材料主要是指化合物半导体材料,如砷化镓、锑化铟;第三代半导体材料主要分为碳化硅SiC和氮化镓GaN,相比于第一、二代半导体,其具有更高的禁带宽度、高击穿电压、电导率和热导率,在高温、高压、高功率和高频领域将替代前两代半导体材料。
碳化硅(SiC)相比于硅基,碳化硅拥有更高的禁带宽度、电导率等优良特性,更适合应用在高功率和高频高速领域,如新能源汽车和 5G 射频器件领域。
随着芯片在不同领域的应用,半导体材料也在随之发展。但如果扣回本题,新材料在CPU上应用概率很小。
异构整合
广义而言,就是将两种不同的芯片,例如记忆体+逻辑芯片、光电+电子元件等,透过封装、3D 堆叠等技术整合在一起。换句话说,将两种不同制程、不同性质的芯片整合在一起,都可称为是异构整合。
因为应用市场更加的多元,每项产品的成本、性能和目标族群都不同,因此所需的异构整合技术也不尽相同,市场分众化趋势逐渐浮现。为此,IC 代工、制造及半导体设备业者纷纷投入异构整合发展,2.5D、3D 封装、Chiplets 等现今热门的封装技术,便是基于异构整合的想法,如雨后春笋般浮现。
封装
封装并不能直接提高芯片的性能,但是先进的3D封装工艺相较于传统的2D工艺有很多优势:
[*]3D封装更有效的利用了硅片的有效区域
[*]3D设计替代单芯片封装缩小了器件尺寸、减轻了重量
[*]3D封装的die直接互连,互连线长度显著缩短,信号传输得更快且所受干扰更小
台积电的Wafer-on-Wafer(WoW) 3D芯片封装工艺,是通过TSV硅穿孔技术实现了真正的3D封装,和Intel的Foreros 3D封装类似,能把多个芯片像盖房子那样一层层堆叠起来,甚至能把不同工艺、结构和用途的芯片封在一起。
TSV也是非常火的技术,要知道数据的搬运速率对CPU性能的影响是非常大的。
3D封装示意图
Chiplet
Chiplet技术就像拼图一样,把小芯片组成大芯片。
使用Chiplets 有三大好处。因为先进制程成本非常高昂,特别是模拟电路、I/O 等愈来愈难以随着制程技术缩小,而Chiplets 是将电路分割成独立的小芯片,并各自强化功能、制程技术及尺寸,最后整合在一起,以克服制程难以微缩的挑战。
此外,基于Chiplets 还可以使用现有的成熟芯片降低开发和验证成本。
从上面的分析也可以看出来,异构-chiplet-封装也是相辅相成,共同发展的。
SoC
SOC(System-On-Chip), 即片上系统。可以简单的理解为把系统做在一块芯片上。
一个完整的SoC通常包含以下几个模块:
中央处理器(CPU)-- SoC的“大脑”。运行Android 或者IOS和大多数应用程序的大部分代码。
图形处理单元(GPU)-- 处理与图形有关的任务,例如可视化应用程序的用户界面和2D、3D游戏。
图像处理单元(ISP)--将手机摄像头中的数据转换为图像和视频文件,对图像用AI算法进行进阶处理。
数字信号处理器(DSP)-- 处理比CPU更复杂的数学功能。包括解压缩音乐文件和分析陀螺仪传感器数据。
基带处理单元BBU(Building Base band Unite)—用于网络覆盖。
存储器(ROM/RAM)-- 用来存储程序和各种数据信息的记忆部件。存储器可分为主存储器(简称主存或内存)和辅助存储器(简称辅存或外存)两大类。和CPU直接交换信息的是主存。
神经处理单元(NPU)-- 用于高端智能手机,以加速机器学习(AI)任务。这些包括语音识别和相机处理。
除了以上几个主要单元,还有蓝牙,5G,WI-FI等模块。
SOC技术可以有效地降低电子信息系统产品的开发成本,缩短开发周期,提高产品的竞争力,是未来工业界将采用的最主要的产品开发方式。
AI芯片
也就是人工智能芯片,上面再SOC里已经提到了,NPU用于加速神经网络的运算,解决传统芯片在神经网络运算时效率低下的问题。
除了NPU,还有TPU(Tensor Processing Unit)即张量处理单元。
如图是一款为机器学习而定制的人工智能处理器。经过了专门深度机器学习方面的训练,它有更高的计算能力。TPU在经过深度学习方面的训练,执行每个操作所需的晶体管数量更少,自然效率更高。
<hr/>从突破性的技术来看,主要有量子芯片和碳基芯片。
相对来说,这两种技术目前还处在实验室研发阶段,距离商用尚远,从目前的信息来看,顺利的话,量子芯片要十年甚至更久,碳基芯片也要五年左右。
摩尔定律(我认为叫摩尔规律更恰当)放缓,CPU的性能并不会走到尽头。人们为了对抗摩尔定律的失效,不断在研发新技术、新架构、新材料为摩尔定律续命,同时也在不同的方向进行探索,CPU这个跨越世纪的重器,也将在未来十年焕发新春。 作为一个硬件开发人员,我希望是CPU能把DDR这部分整合封装进去,按照DDR配置,分出2-3种尾缀的细分型号。
其实一些消费类的广义上的SOC性质的CPU里已经有这样的作法了,比如全志的F133:
这样做的好处有很多:
1、板子的尺寸可以大大缩小,缩小的不仅仅是DDR占用的空间,还有CPU的DDR几十个pin脚的引出,CPU到DDR的庞大的走线,可能可以缩减PCB的层数,降低成本,这些点对一些便携紧凑设备的产品化是非常有好处的。
2、大大降低硬件工程师Layout难度,工作量,缩减开发周期。
3、大大降低在设计中的风险,增加可靠性,一方面是layout性能差异,另一方面是软件底层驱动上,CPU应对不同DDR的参数差异。
森山:60天掌握CADENCE-电路设计原创教程【硬件工程师的自我修养】森山:如何打造自己的低成本电子实验室? Intel:我们在数字上要盖过amd,消费者认为数字大就是好,虽然我们的单die拼不过amd的胶水,但是我们营销游戏上一定要盖过对手;你看amd 12核24线程,我们就16核24线程,大过你哟!数学学得好,有没有一夜超AMD的感觉?
<a data-draft-node="block" data-draft-type="mcn-link-card" data-mcn-id="1453355534129213440">amd:我们的胶水还有更大的空间,L3缓存给我加到以GB为单位,我们已经找到感觉了,Intel追上我们至少还要2年;就按 @Harry Zhu 给我们设计的“线程撕碎者”系列制造,我要让Intel哭不出声音;
amd的多核心比intel是不是领先很多?M1:我不是针对谁,我是说在座的各位,all of you,Intel、AMD、Qualcomm,都是**;
Nvidia:(一人一巴掌)超超,超超,叫你们超超,给了Intel一个爆栗子,16核也得瑟,你那是16核吗?我塔玛18432核我超超了吗?低调,做人要低调,我加个风扇就能多卖3000块,我骄傲了吗?
Qualcomm:技术人的事儿,你那不能算…;
Nvidia:还顶嘴,你信不信我把你家祖坟都给刨了(指收购arm)…
通用CPU集成度不断增加,各种芯片逐渐被CPU拿下,早期的北桥芯片,到后来的集成显卡,以及各种总线以及被CPU统一涵盖。目前内存和硬盘虽然还是单独的,但是早晚也是被替代的。
如果所谓的云计电脑真的来临,用户对于内存硬盘的需求不那么个性化,那么替代时间会早点来临。另一个是苹果最新的CPU,已经将内存集成到了CPU内,以苹果的生态,再集成一个硬盘也是有可能的。
最后,主板就只剩下电源管理之类的芯片,在一个类似usb一拖四的外围扩展io就OK了。 CPU是计算机的运算和控制核心,作为算力基础,是整个科技行业的核心支撑。
1971年11月15日,美国英特尔公司推出世界第一款商用计算机微处理器Intel 4004,被认为是CPU发展史的开端。
中央处理器(CPU,Central Processing Unit)是一台计算机的运算和控制核心,其功能主要是完成对计算机指令的执行和对数据的处理,CPU 与内部存储器、输入/输出设备被认为是电子计算机三大核心部件。
CPU的发展史,按照其处理信息的字长,可以分为:4位微处理器8位微处理器、16位微处理器、32位微处理器以及64位微处理器等等。5G、云计算、物联网、大数据、人工智能等创新领域的发展,对算力的需求也大幅增加,CPU作 为科技领域的算力支撑后续需求有望迎来发展机遇。目前来看,CPU市场仍主要为海外巨头占据,国内CPU厂商起步较晚仍处于劣势,但十四五以来国产CPU自主研发受到高度重视,目前已走出三条独立自主化道路,国家政策层面始终高度重视“卡脖子” 领域自主创新,技术产品层面,政策支持叠加行业发展加快生态建设,国产CPU或迎来重大利好发展的机遇。
@壹只猫 的这里,整理了CPU行业报告,或许对这个问题的问题的回答有帮助:
中国长城公司首次覆盖报告:国产CPU巨头,充分受益国产化浪潮.pdf
中国长城:ARM生态大势所趋,飞腾CPU力争市场大份额.pdf
全球半导体观察(5月):除CPU以外下半年需求能见度均较低.pdf
半导体行业:国产CPU之曙光.pdf
澜起科技公司深度报告:服务器CPU升级,内存接口随风起波澜.pdf
电子元器件服务器系列报告一(计算篇):CPU平台升级及其影响.pdf
电子元器件行业深度分析:数据中心产业链梳理:CPU平台升级,DRAM周期反转.pdf
电子行业深度报告:CPU研究框架.pdf
科技先锋系列报告174:服务器CPU芯片:Intel&AMD布局.pdf
科技:云计算开启国产CPU和AI芯片的腾飞之路.pdf
计算机应用行业点评报告:电信招国产CPU占比超三成,阿拉斯加交锋提速信创.pdf
计算机行业“智能网联”系列专题之六:汽车“CPU”从ADAS到自动驾驶.pdf
计算机行业研究:国产CPU全对比,飞腾有望异军突起.pdf
计算机软硬件专题研究:信创产业系列报告之一CPU&OS:信创根基,国之重器.pdf
计算机:CPU生态价值与机遇研究.pdf
计算机:运营商提升国产CPU服务器采购比例,行业信创加速落地.pdf目前CPU主要有两种指令集架构:
[*]复杂指令集架构CISC(Complex Instruction Set Computer):x86
[*]精简指令集架构RISC(Reduced Instruction Set Computer):ARM、MIPS和RISC-V
CISC 与 RISC 架构处理器各有千秋,CISC 架构芯片运行 速度快、性能优越,但功耗大、价格较贵;RISC 架构芯片体积小、低功耗、性价比高。目前整体来看,在移动芯片领域,以 ARM 为代表的 RISC 架构的芯片占据了 90%以上的市场份额,在计算 CPU 市场上,以英特尔 X86 为代表的 CISC 架构处理器占据超过 90%市场份额。
全球智能手机基本全部采用ARM指令集,截止2021Q1,联发科和高通是最主要的手机CPU供应商,市场份额分别为35%和29%;2021年Q1,联发科市场占有率35% ,比2020Q4增长了3个百分点,同比增加了11%,继续扩大优势。高通市场份额为29%,较2020Q4略有增长(1%),同比却下降了2%。苹果为17%,比2020Q4下降了2%。三星在2021Q1已经降至 9%。由于受到去年5月以来美国升级制裁影响,海思的市场份额出现了快速的下滑,到2021年Q1仅剩5%。
我国自2001年开始启动处理器设计项目,至今将近20年,产生了以中科龙芯、天津飞腾、海光信息、上海申威、上海兆芯等 为代表的国产CPU,并且产品的性能逐年提高,应用领域不断扩展,使中国长期以来无“芯”可用的局面得到了极大扭转。
欢迎关注和收藏 @壹只猫
现在,或未来的某一天,对你有用,方便随时找到的同时,让我们成为长期成长关系。 讨论cpu未来发展方向这个问题,我们不妨把视角放的更大一点:未来计算设备会是什么形态?
我认为,未来计算设备应该是以便携设备和各类、多级服务器组成。即,未来家庭、公司可能会配备大量的便携计算设备,运用云计算(包括公有云和私有云)和边缘计算计算进行处理;然后配置一定量的个个级别的服务器进行处理不同问题(通用计算服务器、深度学习服务器甚至服务器集群)。
所以,我认为现在的big-little其实还是更类似一个过渡性的方案,因为实际上大型核心在未来可以很大程度被云计算和边缘计算取代。
所以我倾向于未来cpu有两个方向,即轻负载、低功耗场景下的cpu走向soc化、集成化,重负载、高功耗下的cpu走下模块化、分立化。未来,便携式设备搭载的soc中应该是集成了高性能网络芯片、处理器、内存、GPU的整体,而即冯诺依曼架构图中间部分的所有组件+gpu。然后主板接近于一个扩展板和供电板。而高负载下的设备,应该具有模块化的不同插槽用于接入不同的组件,甚至可以通过高速的光纤网络进行共享。 计算平台,而不再只是一个黑盒。会开放更多接口给各类计算单元。真正实现万物互联。 硬件的发展离不开应用,CPU也是这样。随着元宇宙概念的爆发,大大增加了对CPU更高速度的需求,相信会加快CPU的发展。
我们先简单回顾一下CPU的发展:从1993年起CPU每次更新换代都专注在制造工艺技术的提升,从Pentium的0.6μm (微米),320万个晶体管核心,60MHz 核心频率,直到2021年11月刚出的 Alder Lake 用 10nm (毫微米, 比微米小1000倍)制造工艺, 1000亿个晶体管。
根据摩尔定律,集成电路上可以容纳的晶体管数目在大约每经过18个月便会增加一倍。而在12月13日举行的IEEE International Electron Devices Meeting(IEDM)2021,英特尔展示了跟着他们CPU的发展方向:
[*]对基础缩放技术开展重要研究,以在未来产品中引入更多晶体管
发展出针对混合键合互连设计、工艺与组装挑战的解决方案,预计可将封装互连密度提升至 10 倍以上。在 7 月份的 Intel Accelerated 活动上,英特尔就已经宣布了 Foveros Direct 的推出计划。特点是支持亚 10 微米的凸点间距,有望将 3D 堆叠的互连密度再提升一个数量级。
为了让生态合作伙伴也能够从小芯片等先进封装技术上获益,英特尔还呼吁建立新的行业标准与测试程序。
2. 发展新的硅基材料以增加功率以及记忆体
通过在 300mm 晶圆上率先实现基于氮化镓(GaN)的功率开关、结合硅基的 CMOS,英特尔正在推进更高效的功率器件技术。
换言之,这为 CPU 的高速供电和更低能耗损失奠定了基础,同时减少了对主板组件和空间的需求,此外还有行业领先的低延迟读 / 写体验。
得益于新型铁电材料和下一代 DRAM 技术,其有助于提供更大的内存资源,以化解从游戏到人工智能等计算应用程序面临的日益复杂的问题。
3. 量子运算
寻找以晶体硅体管为基础的量子运算的强劲性能,以及与新型室温设备搭配运行,拥有巨量能源效率运算的全新开关。
IEDM 2021英特尔展示室温运行的全球首款实验性磁电自旋轨道(magnetoelectric spin-orbit,MESO)逻辑设备,显示基于开关纳米规模磁铁的新型晶体管制造潜力。
英特尔和IMEC在自旋电子材料研究取得进展,将设备集成研究更进一步带往实现全功能自旋转距(spin-torque)设备。英特尔还展出与CMOS生生产机制造兼容,实现可扩展量子运算的完整300mm量子位元制程流程,确定研究的下一步。