谢邀,我曾经也以为我把图形学的知识点都掌握了,我也觉得这个领域,特别是光照物理模拟上理论已经到头了,再发展都是些小修小补,例如采样的trick提升raytrace性能,各种模拟近似的优化提升实时计算性能,再然后就是物理模拟领域的结合,等等,像PBR这样的理论突破相当困难。
直到...看到这几年神经网络开始在图形学领域大力出奇迹,完全颠覆了我对图形学的认知,例如:
Nvidia通过每个像素一次raytrace采样,然后用神经网络优化降噪,以达到实时raytrace,Introducing the NVIDIA RTX Ray Tracing Platform
Facebook使用深度神经网络将人脸的4D数据 encode成隐式的BRDF纹理/材质和Deformation Graph 来实现photo realistic的人脸渲染和超低带宽数据传输 Facebook animates photo-realistic avatars to mimic VR users’ faces
Nvidia通过神经网络超分辨率采样(DLSS),将低分辨率渲染的G buffer(Normla,depth,RGB)放大到2K甚至4K 实现高性能渲染 DLSS: What Does It Mean for Game Developers? - NVIDIA Developer News Center
这些新的研究成果让我看到,以前图形学那种干净的数学公式可能表达能力会被神经网络超越,干净的结构化数据(Volume,Point Cloud,Mesh)表达能力会被隐式的,经过神经网络降维的非结构化数据超越,这需要全新的数学理论和图形学框架来支持,虽然底层物理意义还是raytrace,brdf那一套,但计算过程会完全不一样。
我是非常一颗赛艇的。
作为小白提供一些自己的拙见...我和我老板主要是做character motion control的,算是图形学里面很小众的一个方向了。感觉这个方向里待解决的问题非常多。比如如何自动评估一段animation的质量,如何去做到更加复杂的motion control,motion control with environment interaction...都是些不简单的问题,足够phd做好多年...
CV是2D到3D,CG是从3D到2D。很有意思的是,组里有两个方向(有兴趣可以看一下uvic visual computing group):传统CG和CV。呆的不长,但是给我直观的感觉是: CG数学真是厉害,公式秀出天际,C++也是玩得溜起,(解答一下答主关于CGer的气质和能力需求的问题)给CGer点个赞。
但是CG 同事们似乎都在吐槽,CG出成果就是慢,有些同事已经转到纯CV,或是从用DL来解决某些CG的小问题(e.g.,去年出一个differentiable render了)。从一个CV小白的视角来看(求建议和交流),3D vision,3D understanding 和CG的结合会比较有意思。 感觉组里这种CG和CV组合应该也是有这种初衷的。大致就是:Bring semantic information from 3D world to CG. 比如说Non-rigid 3D reconstruction 和 visualization。
VR用户的视角