找回密码
 立即注册
查看: 406|回复: 10

浅谈计算机视觉和图像处理

[复制链接]
发表于 2022-5-23 14:05 | 显示全部楼层 |阅读模式
引言:
最近发现很多人会问如何入门计算机视觉,特别是刚想在这个方向发展的同学,还会看到很多人会问图像处理和计算机视觉(特指如今的深度学习)哪个好,有什么区别,这里我是把两者放到一起。
个人看法:
图像处理和计算机视觉其实两者并不冲突,还是要从任务上来说。首先要明白,输入图像(或视频),在计算机中是矩阵。计算机是利用矩阵来表达图像。无论传统方法,还是深度学习,其实都是对矩阵进行处理。以图像降噪这个任务为例,不论是学术界还是工业届,图像降噪都是常见的任务之一,最传统的高斯滤波,在当今深度学习统治的时代下,仍然有人在用,传统图像算法里面各种滤波,包括非局部滤波和BM3D,以及利用深度学习降噪网络,在我看来只是不同的方案而已,当然了,学术界里面深度学习在各种图像任务上逐渐成为了主流。但是在工业界,往往一个模型解决不了问题,大多数时候是传统图像处理算法和深度学习网络组合运用。
自己算是在互联网摸爬滚打了几年,主要是做业务,深度学习肯定是要用的,很多时候深度学习的效果确实能碾压传统算法,但是工作上也离不开传统算法,业务上的问题往往不是一个模型能搞定的,会遇到各种情况,就像网上调侃的,几百个if else,这虽然是夸张,但是不得不说最终线上的服务是一个很复杂的系统,需要考虑各种情况。此外,深度学习需要数据,而且需要的数据很多,在最开始没有标注数据的时候,如何虚拟造数据,或者利用传统的算法收集数据,以及对数据进行预处理,以更方便的进行数据标注,在日常工作中也很重要。比如人脸识别,人脸识别进行数据标注的时候往往是对数据进行提特征,然后聚类,将聚类结果再交由人工标注,这样能节约标注时间、成本;再比如之前为了标注搞文字识别的数据,当时发现直接造数据效果还是差了一些,毕竟造的数据和真实数据还是有gap,后来走了一新流程,先造数据,然后打印再拍照,这样数据就更逼近真实数据了,需要的人力只是打印+拍照,不需要标注,但是由于拍照会有角度和位置偏移,所以当时专门多画了定位块,对拍照图像进行定位块检测来进行几何关系确定,定位块检测也是用传统方法来做,因为不可能为这个事再搞数据训模型,论文里面往往不会提到数据标注,但是做业务的时候却学要。
还有一点我想说的是,如果大家看论文比较多的话,首先各种论文里面也会涉及到比如连通域分析、开闭运算、滤波等等一系列操作,更重要的是,很多深度学习的算法也借鉴了传统图像的算法,比如视频分类中有一些会将视频的光流场作为输入, 比如stn网络是利用网络来学习放射变换的参数。
所以在我看来,即便是今天深度学习成为主流的时代,传统方法也不能完全抛弃,也不能完全不了解,如今的凯明大神,在深度学习之前,传统方法也是玩得飞起,当年的暗通道去雾可以说是神乎其技。如果想搞计算机视觉,一些常见的传统方法至少是要了解的。很幸运我之前主要是学传统方法,赶上深度学习的浪潮之后才转入深度学习,之前的一些图像基础并不是完全没有用。
关于入门:
关于入门,我的经验是理论基础+实战。先说理论基础,不太懂理论的话,短时间内可能没什么问题,就像大家说的目前算法工程师大多时候是组合封好的函数,处理数据,但是长期这样是走不远的,自己的价值,或者说不可替代性更多的是解决业务上的问题,直接调用只能说是一个baseline,能不断优化就需要理论基础和项目经验了,而这也是目前大多从业人员不足的地方。可以说目前算法工程师太饱和了,但是大多数都只是停留在跑跑开源代码,调一调参数,处理一下数据,这样项目的结果大家都差不多,真正能根据经验以及理论基础解决业务上痛点问题的人其实很少,也只有这样的人发展才能更好;再说实战,如果只看了理论不跑跑代码的话会没有感觉,对,就是没有感觉,跑了代码,看下效果才有直观的感觉。
结合自己的经验,个人觉得新手入门的话,可能需要了解的常见的传统算法,比如降噪、各种算子、图像配准(算子、光流)、图像分割;以及基于深度学习的图像分类和图像检测。
最近准备写一个系列,介绍入门算法原理以及对应的实战代码,如果大家有想了解的欢迎关注、留言,这个系列是准备写给想要或者刚入门的同学,如果想了解最近前沿算法也欢迎交流,我是 @凤舞九天 ~
发表于 2022-5-23 14:09 | 显示全部楼层
作者您好,我是国内数学本硕,导师是压缩感知领域做信号处理的,我在组里负责的是压缩感知算法的优化。我找工作想找传统图像的优化,时间原因,只能向低秩/稀疏图像那个方向走。不知道这样会不会就业面比较窄?
发表于 2022-5-23 14:14 | 显示全部楼层
这个方向确实比较窄,不过是数学本硕的话也没必要把自己限定的太死,找工作的时候可以多看看,对校招生是要培养的,主要看分析问题和解决问题的能力以及一些基础,对社招才是来了就得干活
发表于 2022-5-23 14:16 | 显示全部楼层
非常感谢!
发表于 2022-5-23 14:22 | 显示全部楼层
应对秋招,我现在计划的是学习图像处理领域的两本经典教材+有一篇正在做的图像降噪的论文工作(基于凸优化)+暑假的一个图像比赛(用深度学习)。您还有什么建议吗?
发表于 2022-5-23 14:24 | 显示全部楼层
经典教材大概看看就好,那么多东西记不住也没必要,找一两个方向弄熟就可以;如果想找互联网刷题和至少SVM,逻辑回归要吃透
发表于 2022-5-23 14:26 | 显示全部楼层
好的!谢谢[赞同][赞同]
发表于 2022-5-23 14:27 | 显示全部楼层
您好,我感觉做算法大部分时间是怎么造数据和处理数据,例如目标检测分析一下长尾分布和检测框分布,针对性的小改一下网络或数据,训练再训练,然后在用c++部署一下。就是感觉很没有成长的感觉,只是对数据处理走了部分提升,我不知道大家都是这样吗?
发表于 2022-5-23 14:31 | 显示全部楼层
都是这样,如何造数据,如何标数据
发表于 2022-5-23 14:34 | 显示全部楼层
您好!请问本科生适合做或者说是有可能做这些方向的工作吗
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-27 04:12 , Processed in 0.096236 second(s), 25 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表