找回密码
 立即注册
查看: 715|回复: 12

Win 10 2004的硬件加速图形处理器(GPU)功能真的有那么强大吗?

[复制链接]
发表于 2021-8-20 17:50 | 显示全部楼层 |阅读模式
最近在很多群里看到游戏帧数提高20帧的言论,想问一下各位的实际体验,尤其是在低性能设备上?
发表于 2021-8-20 17:51 | 显示全部楼层
无意间看到本问题的一个回复,顿时感觉我穿越到了未来,纳尼?win10 2004这是又搞了啥黑科技?我大CPU要亡了?虽然第一时间感觉那回答不靠谱,我还是老老实实的去搜了一把,弄了半天。可能是这玩意:
微软最新的Win10版本(2004版,目前是测试版)已经加入了一个新的功能,就是硬件加速GPU计划 ,这个功能有助手减少延迟,改进你显卡的性能
英文名字叫这个:Hardware-accelerated GPU scheduling
这个翻译明显有问题,更好一点的翻译应该是:硬件加速GPU调度,嗯,只是改善了调度,可能会有提升,但是应该不是特别明显,有些网站的测评也证实了这一点:
Wccftech选择了Core i9-9900K+RTX 2080 Ti/GTX 1650 SUPER这样两套平台,在RTX 2080 Ti上面启用硬件调度的性能变化并不明显,但是在GTX 1650 SUPER这样一张主流级显卡上面则是出现了明显的提升。其原因,如果按照NVIDIA方面的说法来解释,那就是由GPU直接管理显存在效率上带来了一定的提升。也许,这项功能会为很多主流级平台带来可观的免费性能增幅,而对高端平台来说,影响是微乎其微的。
发表于 2021-8-20 17:51 | 显示全部楼层
目前已知的,神界:原罪2开启GPU加速后,GPU占用率极低,无法游玩
发表于 2021-8-20 17:52 | 显示全部楼层
功能比较强大,但是应用很受限。
<hr/>咱不知道你们对这个功能到底是有多大的误解。说让视频播放还有游戏中CPU执行的部分让GPU参与的,还有一位可以利用GPU多核心特性的,咱看着就尴尬啊。
GPU参与通用计算,本质上还是属于异构计算的范畴。虽然GPU比CPU多了很多核心,但是这些核心是不能像CPU那样独立调度使用的。现在最新架构还没关注,比较早的架构的话,被划分成一个组的若干个核心,甚至不能运行同一个程序的两个不同分支的;换句话说,即使你写了一个if分支语句,而其中有几个核心出现了和其他核心不同的分支方向,那么这几个核心就得等其他核心运算结束后单独拿时间来计算自己的分支。
所以说虽然看起来GPU也是个多核心的家伙,看起来也可以做并行计算,但是代码里要处理的问题完全不同啊亲。直接拿CPU代码,用指令翻译之类的方式送给GPU跑的话,那速度估计是要回归奔4了(未经严格比较)。所以说现在才回有各种,专门给GPU写代码的岗位啊。你觉得Windows这一个开关能做到自动把一种处理模式下最优化的代码,自动转换成另一种架构下最优化的代码并执行么?
所以说这东西,可能和部分人还有媒体想象的不太一样的。

至于说这东西到底做了个什么事情。翻开操作系统原理教材,操作系统的作用之一就包括了计算机资源管理这一项。说人话就是,这台电脑只有一张声卡,不能让任何一个程序独自接管这个声卡,操作系统要让所有程序都能在上面播放声音;这台电脑只有一张显卡,不能只让一个程序可以在显卡上有显示,不能只让一个程序可以在显卡上运行计算程序,所以操作系统需要让许多个程序同时使用显卡这一种硬件。
那么接下来就遇到一个问题,显卡上的资源该如何分配?每个程序可以拿到多大的显存,可以使用多少个计算核心之类的。这部分操作,过去一直是在CPU上运行的,而随着GPU的发展,它带有了可以在一定程度上实现这种功能的硬件之后,Win10开始提供这个选项,允许你使用GPU自带的显存管理器之类的。仅此而已。
<hr/>另外建议题主修改一下题目,这个功能不是叫“硬件加速GPU计划”么?咱一直就很想吐槽微软的翻译水准,原文应该是Hardware-accelerated GPU scheduling,难道不应该翻译成“硬件加速GPU调度”么?
他自己名字都说了,自己加速的GPU调度,是多个程序共享GPU资源时的资源调度。并不会真正加速GPU运行,也不会自动用GPU加速CPU上程序的运行的。

<hr/>编辑回答
虽然题主没有问,但是评论区有人问到了,关于为什么会提高帧数这一点。
关键点在于,没有启动这个功能的时候,GPU资源调度的工作是有CPU来处理的。而现在这个过程可以直接在GPU内部完成。
简单理解的话,如果由CPU来负责GPU调度的模式,类似下属的所有事情都要交给上司审阅的模式;那么GPU自行调度就是上司下放了一定的权限给下属,某些事情可以由下属自行决定而不必等待上司回复。高性能的CPU就仿佛是工作能力很强的上司,可以瞬间完成工作的指派;而低性能的CPU就仿佛是个手忙脚乱的上司,尽管GPU那边已经闲下来了,但是CPU还没准备好下一步的指令。
也就说这个功能不是加速了GPU,而是在一定程度上防止了性能较差的CPU拖慢了GPU。不是帧数提高了,而是你的电脑一开始就没能充分调动GPU的能力。
发表于 2021-8-20 17:58 | 显示全部楼层
我配置是10700+1080ti+32g高频条。
4k分辨率全面战争三国中高特效,帧数从大约28提升到45。
4k分辨率彩虹六号最高特效+TAA倍数100,帧率从40-50(贫民窟地图4k是真的卡)提升到稳定60(贫民窟除外,只有50-60波动)
提升很大,1080ti变成2080ti的感觉。
发表于 2021-8-20 18:08 | 显示全部楼层
2004的GPU加速本质上是让GPU更加主动的参与到以前CPU做的事情中去,比如播放视频、游戏中的CPU执行部分,现在GPU都会参与的更多。
据我的观察,GPU和CPU在处理事情的时候效果不同,GPU处理稳定平滑,而CPU会时快时慢。直观的感受是如果一个游戏卡CPU瓶颈,则会卡顿,而卡GPU瓶颈,则帧数下降,但帧生成稳定性一般保持较稳定,不会出现明显即时性卡顿。
现在的GPU加速,让GPU更多的参与游戏中,直观感受是,稳定性提升远远大于帧数提升。帧数生成比较平滑,整个游戏会顺畅很多。
但这块20系卡最明显、另外DX12的新游戏最明显。还有个,低U高显最明显。
我是E31230V3+2060的配置,控制、地平线零之曙光,都运行在4K分辨率下,平均帧都在30-40帧左右,2004的GPU加速开启不会将帧数提升多少,因为我2060早就超频到2010,显存也是在7500,E3也是锁3.7,内存DDR3超2400。
但我的观察有2点,1个是2060因为是6G显存,所以4K下动态调用显存,场景中部分物件会低模显示,过去动态显存调用一般控制在5500的大小,而现在GPU加速开启后控制在5700到5900,同时非常厉害的在于,场景中低模显示少太多了,我相信这是因为使用了自适应着色器,将低模部分优化到远景去了,同时大量的优化了显存不断调用的效率,使得整个画面4K高材质覆盖率大幅度上升。
第二点就是整个流畅度大幅度上升,这个流畅度上升堪比从1600的内存上到2400的程度,30帧下,就可以让地平线中鼠标的直接瞄准机械兽各种弱点丝般顺滑,因为这30帧虽然不高,但帧稳定性非常好,理论上如果稳定性趋于完美,我们看24帧电影也是丝般顺滑不是吗?
所以2004的GPU加速,对于低U高显,20系配置,直接上4K,玩3A大作满特效的人来说,可以说是鸡血,记住,帧数远远没有帧生成稳定重要,而游戏让GPU主导之后,整个游戏的生成过程会偏向GPU的特性,即稳定,实时满负荷的那种流畅感。
但我想,这一切都基于新游戏特性,3A上很好,这是明显的向着最新的优化技术靠的优化体系,恐怕对老的、优化差的、吃鸡、LOL这种,效果不明显。
另外提一下,30系将引入RTX IO,将进一步介入CPU最大的瓶颈,即开放世界的实时载入,也就是众生平等奥德赛之所以众生平等的原因,我下面是准备直入3080,没错,E31230V3直接带3080,我有理由相信,未来随着显卡大部分代替掉CPU的工作之后,E3完全可以配合3080执行4K60帧丝般顺滑的次时代游戏体验。
PS:做个补充,GPU介入游戏中更多CPU做的事情,并不全是优势,也有可能是劣势。比如在我的配置上,4K运行贪婪之秋,不开GPU加速有40帧,开GPU加速会变成20帧,CPU负载会从60%-90%降为30%左右,这就非常尴尬,属于忙的忙死,闲的闲死,此时就要关闭GPU加速,让CPU担当起责任来。当然我相信3080之后,这个问题不复存在。
所以2004的GPU加速算是一个手动调控GPU和CPU负载的开关,如果你觉得游戏出现了CPU内存瓶颈式的卡顿,则可开GPU加速,当你发现GPU无法满足30帧左右的最低帧数,已经在100%负载下依旧只能维持20左右甚至更低,则关闭GPU加速。
另外还有一点,GPU接管CPU需要测试,有的游戏接管的不好,反过来会影响GPU负载,也就是GPU要拉一部分负载不定期去做CPU的事情,结果导致GPU波动,这样就悲剧了。
我现在测试,有了GPU加速之后,仁王、还有类暗黑类游戏,提升很明显,他非常适应那种以前能到个50-60帧,但还是觉得不够流畅的游戏,但在以前能到30-40帧左右的游戏,CPU要满负荷的,比如奥德赛,贪婪之秋,这种开GPU加速要小心,搞不好就弄成了20帧。地平线是个特例。

PPS:最新的30系发布后老黄第二个显卡驱动发布之后,我觉得GPU加速获得了进一步的优化和提升。我PS中补充的内容可以忽略不计了。现在基本可以无脑开GPU加速,实测他的1%low平均帧比不开高了5帧左右,这可是在4K下我贴死30-60不等的帧数下,1%low提高5帧对流畅度可谓是质的飞跃。
不是我想吹,是这个GPU加速后续的补丁让我觉得2060真的有了战4K的能力。最近B站那个UP主阿狸不是出了一期系统优化游戏特效的视频吗,讲得很好,体积系、阴影系、反射系适当降低,其他全最高,4K,开GPU加速,然后垂直同步30帧,奥德赛在内的的市面顶级3A,基本都可以稳定流畅,而战地1,坦克世界,更可以稍微降一点特效4K70帧之后,保1%low不低于60,U3219Q上运行,丝般顺滑。给你们一个参考。
本来我3080买不到还有点愁,最近看这几波优化下来,3080或者后续什么TI,S之类的可以直接飙着明天618去了。
发表于 2021-8-20 18:13 | 显示全部楼层
简单的理解,大概就是操作系统核心对显卡驱动利用的改进吧。
显卡也是总线pcie 上的图形适配器,需要相应的的硬件厂商的驱动,也需要系统核心对其更好的调用方式。
有可能是更直接的使用了硬件设备,对显卡驱动的稳定性要求更高,不然会看到熟悉的蓝屏......
发表于 2021-8-20 18:22 | 显示全部楼层
这个功能似乎就是让GPU自己管理显存,感觉没啥好吹的
发表于 2021-8-20 18:23 | 显示全部楼层
这个功能大佬们都解释过了,就是让GPU自己管理显存,结果我发现让它自己整就是乱搞,导出一个PR视频打开任务管理器来一看,结果用到3D显存那一块去了,正常来讲应该是在copy或者video encode
发表于 2021-8-20 18:25 | 显示全部楼层
题主想问尤其是在低性能设备上的体验,这一群最低1080ti的回答,真让我一个低压U+核显的瑟瑟发抖
问就是还没把更新发给我,就那个准备好更新的页面显示了大半年了。3月又3月,3月又3月,还不更新,都快一年了老大!
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-24 14:24 , Processed in 0.193985 second(s), 25 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表