找回密码
 立即注册
查看: 420|回复: 5

0基础自学图像处理→机器视觉→深度学习,应该怎么入门?

[复制链接]
发表于 2021-8-3 20:53 | 显示全部楼层 |阅读模式
本人刚考上国内某985,导师是ICT方向的,与机器视觉方向差距大不大?另外希望前辈们能大概列一下机器视觉入门到深入的学习顺序。图像处理包涵范围太广,本人还没捋清楚,如果哪里表达失误,还请指出
发表于 2021-8-3 20:59 | 显示全部楼层
图像方面我建议你跟着国外著名大学的专项课程进行系统学习,下面是一些列表供参考。
    Computational Imaging and Display (Gordon Wetzstein, Stanford)Computational Photography (Derek Hoiem, UIUC)Computational Photography (James Hays, Brown)Computational Photography (Ramesh Raskar and Jack Tumblin, SIGGRAPH course)Digital and Computational Photography (Fredo Durand, MIT)Introduction to Computational Photography (Oliver Cossairt, Northwestern)Introduction to Visual Computing (Kyros Kutulakos, University of Toronto)Visual Computing Systems (Kayvon Fatahalian, CMU)16-385 Computer Vision, Spring 2019
你也可以参考我正在撰写的专栏:计算摄影学
其实选择哪门课程还在其次,自己每一课学完后都用自己熟悉的开发语言和图像库去真正动手实际写写代码才能掌握得好。国外这些大学的课程通常会有几次定义非常清晰的作业,也会有结课项目。如果认真去跟着做去练,学完后肯定会有很大收获。
其他如深度学习等方向,也可以如此,很多人推荐的课程有
    吴恩达的Machine Learning,Deep Learning斯坦福的 CS231n: Convolutional Neural Networks for Visual Recognition
发表于 2021-8-3 21:08 | 显示全部楼层
我在阿里开设了深度学习系列课程,欢迎持续关注:
深度学习原理与实践 - AI学习 - 阿里云天池图像处理->深度学习我可以答一波,免费的付费的都有很系统的资源。
推荐关注我们公众号有三AI,一年原创将近百万字的技术文章,大部分是计算机视觉领域,可以参考我们的年终总结:
【年终总结】2019年有三AI做了什么,2020年我们要做什么?我写的4本书:
言有三新书预售,不贵,有料言有三新书来袭!业界首次深入全面讲解深度学习模型设计言有三新书来袭,业界首次深入全面讲解深度学习人脸图像算法言有三新书来袭,业界首本深度学习计算摄影书籍,科技与艺术的结合我们的6个学习小组:
【CV春季划】2021年有三AI-CV春季划出炉,最后一届言有三手把手从零带学【CV夏季划】告别入门,提升眼界,从掌握最有价值的那些CV方向开始【CV秋季划】生成对抗网络GAN有哪些研究和应用,如何循序渐进地学习好?【CV秋季划】模型优化很重要,如何循序渐进地学习好?【CV秋季划】人脸算法那么多,如何循序渐进地学习好?【CV秋季划】图像质量提升与编辑有哪些研究和应用,如何循序渐进地学习好?另外从两个方向来回答这个问题,第一个是怎么系统性进阶,第二个是如何系统性学习。
第一个问题,如何系统性进阶,我斗胆将学习深度学习的同志分为5大境界,分别是白身,初识,不惑,有识,不可知,下面一个一个道来,以计算机视觉方向为例。
http://weixin.qq.com/r/xEw1LebEMbtOraJO9xnW (二维码自动识别)
1 白身

所谓白身境界,就是基本上什么都不会,还没有进入角色。在这个境界需要修行的内容包括:
(1) 熟练掌握linux及其环境下的各类工具的使用(2) 熟练掌握python及机器学习相关库的使用
(3) 掌握c++等高性能语言的基本使用
(4) 知道如何获取和整理,理解数据
(5) 掌握相关的数学基础
(6) 了解计算机视觉的各大研究方向
(7) 了解计算机视觉的各大应用场景
(8) 了解行业的优秀研究人员,知道如何获取最新的资讯,能够熟练阅读简单的技术资料
如果掌握了这些,那么就从白痴,不,是白身境界晋级了。怎么判断这个境界呢?可以参考以下的文章,看看掌握的如何。
AI白身境界系列完整链接:
第一期:【AI白身境】深度学习从弃用windows开始
第二期:【AI白身境】Linux干活三板斧,shell、vim和git
第三期:【AI白身境】学AI必备的python基础
第四期:【AI白身境】深度学习必备图像基础
第五期:【AI白身境】搞计算机视觉必备的OpenCV入门基础
第六期:【AI白身境】只会用Python?g++,CMake和Makefile了解一下
第七期:【AI白身境】学深度学习你不得不知的爬虫基础
第八期: 【AI白身境】深度学习中的数据可视化
第九期:【AI白身境】入行AI需要什么数学基础:左手矩阵论,右手微积分
第十期:【AI白身境】一文览尽计算机视觉研究方向
第十一期:【AI白身境】AI+,都加在哪些应用领域了
第十二期:【AI白身境】究竟谁是paper之王,全球前10的计算机科学家
2 初识

所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法。在这个阶段,需要修行以下内容。
(1) 熟练掌握神经网络
(2) 培养良好的数据敏感性,知道如何正确准备和使用数据
(3) 至少熟练掌握一个深度学习框架的使用
(4) 熟悉深度学习模型的基本训练和调参,网络设计
(5) 掌握归一化,激活机制,最优化等对模型性能的影响
(6) 能熟练评估自己的算法,使用合适的优化准则
我们正在更新这一个系列的文章
AI初识境界系列完整链接:
第一期:【AI初识境】从3次人工智能潮起潮落说起
第二期:【AI初识境】从头理解神经网络-内行与外行的分水岭
第三期:【AI初识境】近20年深度学习在图像领域的重要进展节点
第四期:【AI初识境】激活函数:从人工设计到自动搜索
第五期:【AI初识境】什么是深度学习成功的开始?参数初始化
第六期:【AI初识境】深度学习模型中的Normalization,你懂了多少?
第七期:【AI初识境】为了围剿SGD大家这些年想过的那十几招
第八期:【AI初识境】被Hinton,DeepMind和斯坦福嫌弃的池化,到底是什么?
第九期:【AI初识境】如何增加深度学习模型的泛化能力
第十期:【AI初识境】深度学习模型评估,从图像分类到生成模型
第十一期:【AI初识境】深度学习中常用的损失函数有哪些?
第十二期:【AI初识境】给深度学习新手开始项目时的10条建议
3 不惑

进入到不惑境界,就是向高手迈进的开始了,在这个境界的重点就是进一步巩固知识,并且开始独立思考。如果说学习是一个从模仿,到追随,到创造的过程,那么到这个阶段,应该跳过了追随,进入了创造的阶段。
如果是在学校读研究生,就要能够发表水平不错的文章,如果是在公司做业务,就要能够提出正确且快速的解决方案,如果是写技术文章,就要能够信手拈来原创写作而不需要参考。
这个阶段需要修行以下内容:
(1) 熟练玩转数据和模型对一个任务的影响
(2) 能够准确的分析出模型的优劣,瓶颈
(3) 对于新的任务能够快速寻找和敲定方案
(4) 拥有各种各样的深刻理解深度学习模型的技能,从可视化到参数分析等等等
(5) 能够优化模型到满足业务的需求,实现工业级落地
(6) 了解行业的最新进展,并在某些领域有自己的独到理解
不惑境界的内容
第一期:【AI不惑境】数据压榨有多狠,人工智能就有多成功
第二期:【AI不惑境】网络深度对深度学习模型性能有什么影响?
第三期:【AI不惑境】网络的宽度如何影响深度学习模型的性能?
第四期:【AI不惑境】学习率和batchsize如何影响模型的性能?
第五期:【AI不惑境】残差网络的前世今生与原理
第六期:【AI不惑境】移动端高效网络,卷积拆分和分组的精髓
第七期:【AI不惑境】深度学习中的多尺度模型设计
第八期:【AI不惑境】计算机视觉中注意力机制原理及其模型发展和应用
第九期:【AI不惑境】模型剪枝技术原理及其发展现状和展望
第十期:【AI不惑境】模型量化技术原理及其发展现状和展望
第十一期:【AI不惑境】模型压缩中知识蒸馏技术原理及其发展现状和展望
第十二期:【AI不惑境】AutoML在深度学习模型设计和优化中有哪些用处?
4 有识

到这里,就步入高手境界了。可以大胆地说自己是一个非常合格的深度学习算法工程师甚至是研究员了,在自己研究的领域里处于绝对的行业前沿,对自己暂时不熟悉的领域也能快速地触类旁通。
无论是眼界,学习能力,还是学习态度都是一流水平,时而大智若愚,时而锋芒毕露,当之无愧的大师兄。
5 不可知

最后一个境界,就是不可知境界,超出我能描述的范围了。举一个例子,马文·闵斯基,既可以让AI生,又可以让AI死,这样的人是不会遇到的,放心好了。
这个修行之路仍然在更新中,我们发布了超过360页的指导手册,大家可以去自行获取。
------------------------------------这是分隔线------------------------------------


第二个问题,如何系统性学习,大家就可以去我们公众号《有三AI》和知乎专栏《有三AI学院》看,覆盖CV/NLP两大领域,涵盖深度学习数据和模型、GAN、AutoML等基础技术,人脸图像,医学图像,图像分类分割等应用领域,学习资源、论文推荐、AI行业与产品等学习资料,将近30个专栏。
下面是一些综述性质的总结和两个适合初学者的内容

    有三AI发布360页11万字深度学习CV算法工程师成长指导手册,可下载收藏打印,未完待续 有三AI一周年了,说说我们的初衷,生态和愿景 【杂谈】篇篇精华,有三AI不得不看的技术综述(超过100篇核心干货)【杂谈】GAN对人脸图像算法产生了哪些影响?【杂谈】那些底层的图像处理问题中,GAN能有什么作为? 【技术综述】人脸算法新热点,人脸编辑都有哪些方向,如何学习【技术综述】基于3DMM的三维人脸重建技术总结 【技术综述】深度学习中的数据增强方法都有哪些?【总结】最全1.5万字长文解读7大方向人脸数据集v2.0版,搞计算机视觉怎能不懂人脸【年终总结】2019年有三AI NLP做了什么,明年要做什么?【年终总结】有三AI至今在人脸图像算法领域都分享了哪些内容?【年终总结】2019年有三AI知识星球做了什么,明年又会做什么【小结】除了网络搜索(NAS),AutoML对深度学习模型优化还有哪些贡献?【完结】12篇GAN的优化文章大盘点,浓浓的数学味儿【杂谈】有三AI不得不看的技术综述(超过100篇核心干货)【总结】言有三&阿里天池深度学习模型设计直播汇总,附赠超过200页直播PPT课件【完结】16篇图像分类干货文章总结,从理论到实践全流程大盘点!【完结】12篇文章带你逛遍主流分割网络【完结】优秀的深度学习从业者都有哪些优秀的习惯【完结】给新手的12大深度学习开源框架快速入门项目【杂谈】有三AI专栏作者邀请,在这里写文章能获得什么,有什么不同?
1 深度学习模型设计

模型解读系列文章:
第一期:【模型解读】从LeNet到VGG,看卷积+池化串联的网络结构
第二期:【模型解读】network in network中的1*1卷积,你懂了吗
第三期:【模型解读】GoogLeNet中的inception结构,你看懂了吗
第四期:【模型解读】说说移动端基准模型MobileNets
第五期:【模型解读】pooling去哪儿了?
第六期:【模型解读】resnet中的残差连接,你确定真的看懂了?
第七期:【模型解读】“不正经”的卷积神经网络
第八期:【模型解读】“全连接”的卷积网络,有什么好?
第九期:【模型解读】从“局部连接”回到“全连接”的神经网络
第十期:【模型解读】深度学习网络只能有一个输入吗
第十一期:【模型解读】从2D卷积到3D卷积,都有什么不一样
第十二期:【模型解读】浅析RNN到LSTM
第十三期:【模型解读】历数GAN的5大基本结构
2 开源框架速成(更新完)

开源框架速成系列:
第一篇:【caffe速成】caffe图像分类从模型自定义到测试
第二篇:【tensorflow速成】Tensorflow图像分类从模型自定义到测试
第三篇:【pytorch速成】Pytorch图像分类从模型自定义到测试
第四篇:【paddlepaddle速成】paddlepaddle图像分类从模型自定义到测试
第五篇:【Keras速成】Keras图像分类从模型自定义到测试
第六篇:【mxnet速成】mxnet图像分类从模型自定义到测试
第七篇:【cntk速成】cntk图像分类从模型自定义到测试
第八篇:【chainer速成】chainer图像分类从模型自定义到测试
第九篇:【DL4J速成】Deeplearning4j图像分类从模型自定义到测试
第十篇:【MatConvnet速成】MatConvnet图像分类从模型自定义到测试
第十一篇:【Lasagne速成】Lasagne/Theano图像分类从模型自定义到测试
第十二篇:【darknet速成】Darknet图像分类从模型自定义到测试
将近500篇成系统的文章,超过100万字原创,相信全网没有第二个这样的计算机视觉公众号,希望对你有用。
------------------------------------这是分隔线------------------------------------
另外我们还有一个知识星球社区,也是一年更新几百期原创内容,里面的内容相当的多。
【杂谈】有三AI知识星球指导手册出炉!和公众号相比又有哪些内容?1 知识星球是什么
有三AI知识星球依托于知识星球APP,2019年3月12日创建,目前由言有三全职独立运营
如果说微信公众号是有三AI的第一免费生态,那么有三AI知识星球就是我们的第一付费生态,两者的共同特点是,只专注于做系统性的原创。下面我们来重点介绍一下知识星球社区的特点,有了微信公众号,为什么我们还一定需要知识星球?
2 可以自由提问
公众号和知乎最缺失的内容是什么?实时的自由交流,这就是知识星球最重要的功能之一了。在星球里可以向有三私信提问,也可以直接自己发状态提问和大家交流,还可以向嘉宾提问,有三会在每天睡觉之前清空问题(一些非常难以回答的提问除外)。
关于提问功能,有两点值得大家注意:
(1) 不只是可以向有三提问,也可以向所有人提问,其中我们星球里还有许多重量级的嘉宾,包括阿里达摩院,腾讯AILab,百度IDL,奇虎360AI研究院,海康威视研究院,陌陌深度学习实验室以及其他一线互联网公司AI部门的资深技术专家,主管,甚至是总监;包括计算机视觉,OpenCV,Java,Android等技术领域的行业专家,优秀专业自媒体,畅销书作家,相信在圈子里的大家肯定都认识的;包括CSDN,Gitchat等创始人,相信大家对于敢于当老板的大佬一定是有很多的问题想问的。
(2) 可以选择免费提问,也可以选择付费提问,当你想向大咖提问又不好意思的时候,不妨私信发个红包提问,当然跟有三提问是大家的权益,不需要选择付费私信。
3 存有重要资料
知识星球作为一个社区,还可以补足微信公众号的另外一个短板,存储资料,包括有三分享的也包括星友分享的,下图可以稍微感受一下大家的下载热情。
里面的重点包含两方面内容:
(1)公众号付费图文。公众号已经开启付费图文内容,其中作者同意发布到知识星球社区的,将在一周后进行同步。有三承诺,凡是价值不超过知识星球年费10%的,一律会同步到社区。
(2) 有三非公开分享内容。有很多的资料,比如直播PPT,项目代码,是没法在公众号实时分享的,这会放在星球。有一些以前在公众号分享过的,后续的更新都会及时在星球通知。
4 用户可以赚钱
这第四条想必大家很感兴趣,加入星球固然要交一两百块钱的年费,但是如果你愿意稍微努力一下,很快就能赚回来,甚至远超,因为在这里你确实可以赚钱
(1) 推荐分享我们的星球给别人,如果别人加入,直接可以获得赏金,当前一个人加入赏金就是50元,这非常适合自己还有自媒体平台的朋友,一次赚几百完全不是问题,记得用自己分享的二维码。
(2) 参与小作业,分享干货内容,有三会直接进行打赏,有付出有回报,这才是一个良性的循环。
总之一句话,有心做事,与生态就可以共赢。毕竟不是所有的小伙伴都可以成为公众号的博主,这需要付出很多的时间,但是在社区里,你可以充分展示自己的才华,获得众人的关注,成为人气小偶像,甚至获得不少的付费收入,还有老大们的另眼青睐。
5 参加线下活动
原则上,我们每周都是有线下活动的,有三人在哪,活动就在哪,活动主要是组织当地的大家一起认识,结交人脉,共享资源,今年会增加更多的技术内容。
https://weixin.qq.com/g/AZREHxmYxsKZYsJj (二维码自动识别)
6 大量技术干货
说到这里,就是我们星球中最重要的一块了,那就是我们星球整个的技术内容板块,主要包括AI领域最核心的问题,比如模型设计优化和数据集等,大家可以点击标签快速进入所有内容。
下面对其中的重要板块进行介绍。
(1) 网络结构1000变。我们在公众号推送了很多的模型结构和优化的知识,但是公众号能发的内容是有限的,而模型结构优化的知识太多了,因此我们通常是将入门的,大致的学习路线放在了公众号,而更多的进阶内容放在了星球,形式差不多就是如下,会解读论文细节,提供文章下载,介绍开源项目,有一些会剖析代码,进行实验,本板块不是简短的信息摘要。
以最近三个月的内容为例,我们主要是关注模型优化(模型剪枝,模型量化,模型蒸馏),生成对抗网络(GAN),三维重建等方向。
目前网络结构1000变里面的内容太多了,有三在星球里有超过600条状态,其中一半以上都是网络结构相关的,因此大家可以感受一下,下面是一个目录,细节处大家可以移步星球详读。
(2) 数据集。模型解决了接下来就是数据问题,那么基于什么样的原则做分享呢?星球里不仅包括ImageNet,EffectNet等超过100G的大型数据集,不容易下载的数据集。 也包括各个方向的有趣的数据集,一些案例如下:
如果你想要更多的数据集,直接在星球里求助即可,已经有一些小伙伴这样得到了帮助,瞧瞧没准能节省你不少时间。或许你会觉得,数据集有什么好说的呢?其实不然。一个新的数据集的诞生,往往意味着一个新的方向的开始,你的新idea,或者从此诞生
(3) 其他。除了上述内容,还包括AI1000问,看图猜技术,GitHub项目,AI知识汇总,每周读论文等板块,篇幅和精力有限就不做详细介绍,大家可以看一些图感受一下,阅读本文的一些链接了解详细。
https://t.zsxq.com/RBuN7II (二维码自动识别)
7 寄语
总之一句话,有三AI知识星球生态已经拥有非常庞大的原创内容,有三在这里花费的时间不比其他平台少,而且今年会更多,还要继续拓展技术板块,攻城略地。
如果你看好我们,那就扫码加入吧。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
发表于 2021-8-3 21:17 | 显示全部楼层
大家让开,这个问题让我来答!
首先说结论:ICT和机器视觉没啥关系。不过研究生的专业和实际做的东西往往是两码事,如果你导师让你搞机器视觉,那也是完全有可能的!
本人本科硕士都是光学专业,毕业照样去了某互联网公司做视觉算法工程师。和题主一样非科班出身。
图像处理是一个大学科,通常来说,图像处理指的是一些比较底层的图像处理算法,比如说边缘检测,形态学之类的。有几个相关概念:
    计算机视觉:对于图像识别,检测,分割这种和机器学习粘上关系的一般会叫做计算机视觉,但是要叫图像处理也没啥问题,没必要刻意区分。计算摄影学(立体视觉):这里面就是偏多目视觉,SLAM的内容了。计算机图形学:和图像处理,计算机视觉基本上完全不沾边了,是两套东西。
下面说下机器视觉入门顺序:
数字图像处理 :这个没啥好说的,补理论知识必备。
OpenCV:这个也没啥好说的,和上面搭配,一个理论一个实践。这个也是找工作必备。
MATLAB:学术界的人爱用MATLAB,速度虽然慢,但是代码写起来很轻松。OpenCV是Cpp,用起来麻烦。
好好读一下上面那本书,然后配合OpenCV(或MATLAB)做一些简单的项目,比如车牌识别,图像拼接什么的,就足够了。接下来,就是看自己想往那个方向走了:
    计算摄影学(立体视觉):这个方向业界的主要应用就是AR,SLAM之类的。深度学习:这个不用多说,火得一塌糊涂的AI就是因为这个技术。视觉领域基本上是深度学习一统天下。
上面两个方向会有不同的学习路线,建议选择深度学习,你问我为什么?
因为钱多啊,可以网上搜一下AI算法工程师的薪资表。
最后补充一句:没有老师带的话,最好去实习,否则不要自己往AI方向钻。不然容易高不成,低不就!
发表于 2021-8-3 21:21 | 显示全部楼层
深度学习可以完成很多机器视觉的任务。
在机器视觉领域,卷积神经网络是最常用的深度学习方法。在其基础上还衍生出了残差网络、深度残差收缩网络等。这些应该是需要学习的。
卷积神经网络
残差网络
深度残差收缩网络

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
发表于 2021-8-3 21:23 | 显示全部楼层
1.ict是信息通信吗,那是属于ee类别的,如果要和机器学习搭边的话是语音识别方向,和图像没关系。不过语音识别也可以,门槛高,一般都是科班在搞这个
2.机器学习自学我是肯定持劝退态度的,那些数学推导没大佬带你捋一遍,paper没大佬到你过只能当调包侠和调参侠,等明年后年那些名校视觉硕士毕业了自学的怎么竞争?建议要么找个做视觉的老师要么转语音识别
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-24 01:39 , Processed in 0.095794 second(s), 26 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表