计算机视觉、图形学和图像处理,三者有什么联系?
先说区别1. Computer Graphics,简称 CG 。输入的是对虚拟场景的描述,通常为多边形数组,而每个多边形由三个顶点组成,每个顶点包括三维坐标、贴图坐标、rgb 颜色等。输出的是图像,即二维像素数组。
-> 图片2. Computer Vision,简称 CV。输入的是图像或图像序列,通常来自相机、摄像头或视频文件。输出的是对于图像序列对应的真实世界的理解,比如检测人脸、识别车牌、区分猫狗。
图片 -> dog or cat?
图片 -> 3. Digital Image Processing,简称 DIP。输入的是图像,输出的也是图像。Photoshop 中对一副图像应用滤镜就是典型的一种图像处理。常见操作有模糊、灰度化、增强对比度等。
图片 -> ps后的图片再说联系
1. CG 中也会用到 DIP,现今的三维游戏为了增加表现力都会叠加全屏的后期特效,原理就是 DIP,只是将计算量放在了显卡端。通常的做法是绘制一个全屏的矩形,在 Pixel Shader 中进行图像处理。
2. CV 大量依赖 DIP 来打杂活,比如对需要识别的照片进行预处理,增强对比度、去除噪点。
3. 最后还要提到今年的热点——增强现实(AR),它既需要 CG,又需要 CV,当然也不会漏掉 DIP。它用 DIP 进行预处理,用 CV 进行跟踪物体的识别与姿态获取,用 CG 进行虚拟三维物体的叠加。
转载请保留作者名、注明源自微信公众号“黑客与画家”(HackerAndPainter),关注游戏开发、计算机视觉、图形学、虚拟现实、体感交互等好玩的内容。
差评,每次写的文章都不超过二百字 这篇好像超过了,求好评 在哪可以找到更详细的说明呢?全是点到即止是要逼死强迫症吗(╯‵□′)╯︵┴─┴ 读 opencv 源代码呗 求问 如果一个人从出生一只眼睛失明,他的另一只眼睛还能达到普通双目视觉的程度吗? 还有一个相关问题是为什么成人捂住一只眼睛不影响环境深度获取 单目没有深度信息 m 即便只有一个眼睛,其它信息可以脑补哈。。。 http://www.zhihu.com/question/20672053 这里有更详细的讨论和交流
页:
[1]
2