Zephus
发表于 2021-12-16 06:40
两个不是一个方向。
简单来说,图像处理有用机器学习这类方法去做的。
现在深度学习比较火,导致的一个后果就是所有人都觉得深度学习好像什么都能干,以至于一些啥都不懂的人就会认为图像处理就是深度学习或者说有人就直接把深度学习等同于机器学习了。见怪不怪了已经。
这类招聘我个人估计基本都是要做图像识别的人的,比如人脸识别,或者其他什么物体识别。图像识别用的大部分都是机器学习类的算法,所以他可能就等同起来了。
APSchmidt
发表于 2021-12-16 06:48
我的理解是 机器学习是一些算法的集合 图像处理是一种需求
那么需求可以用算法也可以用其他策略来完成
举几个 图像处理 用 机器学习方法的例子
[*]image denoise如何做?你可能会想 哦 滤波;但很多时候 那些滤波并不能完全解决你的“需求”;有一种叫KSVD http://intranet.daiict.ac.in/~ajit_r/IT530/KSVD_IEEETSP.pdf 的方法,可以用来解决一些image denoise问题 而且效果不赖
[*]face detection/object detection算不算图像处理,似乎叫计算机视觉更合适些,我们假定这是广义的图像处理内容;处理这个“需求”的一种比较famous的方法就是使用 boosting 的策略 来构建一个级联分类器搜:Robust Real-Time Face Detection
[*]image segmentation可以用level set解决,也可以用 normlized-cut(N-Cut)来解决
[*]等等吧 还有很多
ksvd / boosting / N-cut 这些都可以算是 机器学习的内容
所以 图像处理的需求 我用可以用(不一定有)也可以不用 机器学习的方法 来解决(也不一定能完美解决)
RecursiveFrog
发表于 2021-12-16 06:49
图像处理(Image Processing):用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。
机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能(Artificial Intelligence)的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。近年广泛应用于工业界的深度学习(Deep Learning)也属于机器学习的范畴。
这二者都是实现计算机视觉(Computer Vision)不可或缺的助力。图像处理在计算机视觉中一般作为前处理(pre-processing),为机器学习提供用来学习的输入数据,机器学习则负责理解图像。例如在计算机视觉任务中的图像识别(image classification)、物体检测(object detection)、图像分割(image segmentation)中,由于原始数据往往数量不足或者质量较低,图像处理负责对原始图像进行缩放(rescale)和各种数据增强(data augmentation),让机器学习模型更容易学习到图像中的特征。图像处理中对原始图像的一些操作也常常直接应用在机器学习模型中,比如下采样(down sampling)和插值(interpolation)算法,既可以作为对原始图像的处理,也可以作为对机器学习模型中得到的特征图(feature map)的处理。
super1
发表于 2021-12-16 06:58
在深度学习还没有出来之前,计算机视觉主要是通过人工提取高级特征比如LBP、HOG、以及SIFT特征然后用SVM等等算法做识别,而人工提取特征或者前期对图像处理的过程就是你所说的图像处理(二值化,灰度化等等)如今有了深度学习,基本上直接像素点的图输入到神经网络模型中去自动提取特征并分类识别。如果仅仅是想去噪,使图像增强,或者检测图像疵点等等目的,就用不到机器学习方法。
HuldaGnodim
发表于 2021-12-16 06:58
周恩来总理曾经对国内中西医之争说过一句很有名的话:西医好,中医也好,中西医结合更好!
图像处理和机器学习之间的关系大致如此。现在我们所说的图像处理是指运用计算机来对数字图像加以调整的技术,它的研究内容非常广泛,例如增强、去噪、压缩、几何变换等等,具体你可以参考【结合实例与代码谈数字图像处理都研究什么? - 白马负金羁 - 博客频道 - CSDN.NET】
通俗的说,机器学习是让计算机通过数据自我“学到”一个模型的技术。严谨一点,是让计算机以数据为基础,通过学习算法(learning algorithm)从hypothesis set中select 一个最好的“hypothesis”。Anyway, 具体来说,你可能听过的SVM、EM、ANN等都属于机器学习的讨论范畴。
但是图像处理和机器学习二者是可以相互帮助,相互借鉴的。就像现在看西医,有时医生也会开一些中成药(例如板蓝根冲剂)。而现代中医也会借鉴一些西医方法来对中医药进行研究(例如分析一下板蓝根里面的有效化学成分)。举一个具体的例子,图像处理中有时会研究图像中的“对象”到底是什么,这种问题成为object recognition或者image recognition,或者会验证图像里是否含有人脸、是否含有数字、是否含有文字等等。这些都可以借助机器学习的方法,让计算机自己通过数据(例如人脸图片、文字图片等)来进行学习并建立模型以完成图像识别的任务。
总之,图像处理好,机器学习也好,图像处理+机器学习更好!
Doris232
发表于 2021-12-16 07:06
机器学习的本质在于让机器自己去学习,可以用机器学习去做图像处理,也可以用别的方法去做图像处理。
七彩极
发表于 2021-12-16 07:13
首先,我们谈人的视觉系统的复杂性。人的感知系统就是眼耳鼻舌身意。
人的视觉系统只是人感觉系统的基础。人的感觉还受到人的高级意识、情绪变化的直接控制。
举一个例子,人可以绘画。AI计算机根本不可能进行绘画。因为人类文明中的绘画,是人类灵性的表达。
AI机器人,只是一种数学逻辑的计算机表达,AI机器人要真正理解一个图像的真正的内容。必须拥有人类的灵性这个最高级的东西,才会读懂人的面部情绪变化。
一个人的内心活动,与人的面部表情变化,没有绝对的关系。AI机器人要识别一个人在说谎话,比登天都难。但是3岁的小孩,都可以识别成人世界明显的谎话。
AI大佬,知否?????????
首先谈人的视觉感知系统构造。
人的眼睛有着接收及分析视像的不同能力,从而组成知觉,以辨认物象的外貌和所处的空间(距离),及该物在外形和空间上的改变。脑部将眼睛接收到的物象信息,分析出四类主要资料;就是有关物象的空间、色彩、形状及动态。有了这些数据,我们可辨认外物和对外物作出及时和适当的反应。
·当有光线时,人眼睛能辨别物象本体的明暗。物象有了明暗的对比,眼睛便能产生视觉的空间深度,看到对象的立体程度。同时眼睛能识别形状,有助我们辨认物体的形态。此外,人眼能看到色彩,称为色彩视或色觉。此四种视觉的能力,是混为一体使用的,作为我们探察与辨别外界数据,建立视觉感知的源头。
人类视觉系统的感受器官是眼球。·眼睛后段是感光的部分。后段有视网膜,它是由两种感光细胞所组成,这两种细胞因其形状而名为杆状细胞(rod cells)和锥状细胞(cone cells),作用是将水晶体聚焦而成的光线变成电信号,并由神经细胞送往脑部。外界的光线信息进入眼球后,会被眼球内的神经细胞转变为电信号,再被传输送到脑袋中。脑部接收电信号之后,会引起连串的思维活动,并作出适当的行动或反应。·一个视能正常的人,能分辨在视网膜上来自不同投影的影像。这种能力称为”视觉敏锐度”。 在接近视网膜的中央,距离眼角膜最远的地方,这位置称为黄点(fovea) ,是感光细胞最密集,视觉敏锐度最高的位置。
·色视觉原理
·眼睛里有三种不同的锥细胞,分别对红、绿、蓝三种波长的光线敏感,当不同波长的光波进入眼睛并投映在视网膜上时,大脑就通过分析由各个锥细胞输入的信息去感知景物的颜色。
·色盲的形成,是因为视网膜上的锥状细胞不能分辨颜色。大部分人天生具有正常色觉,他们可辨认由三原色调配出来的不同颜色。但亦有人是二色视者,他们只可看见光学三原色中的二种。二色视者又称色弱,他们仍能看见颜色,只是他们看不见其中一种三原色,他们会混淆某些颜色,例如会看不出黄黑条纹颜色,不过可以会出对比大的色样,所以我们设计机动部分的时候,应考虑这一点,提高使用者对危险部分的警觉。但亦有人是全色盲的,他们完全不能分辨颜色,在他们的眼中,世界是全黑白灰的。
·正常人眼可分辨大约七百万种不同颜色,人眼不同区域对颜色有不同的敏感度,眼睛中央对颜色和动态十分敏感,但眼睛边缘的颜色敏感度则较差。不同颜色当中,人对红,绿和黄色则比对蓝色敏锐,这种特性对视象传意有很大的影响
立体视觉
人类和其它的肉食、杂食动物,无需处处提防捕食者,反之要在捕食时准确判断自已与猎物的位置,所以演化出两眼向前的头部结构,并发展出利用双眼所见之差别来计算距离的能力。
运动感知
人类的眼睛会对四种视觉刺激有反应,然后对此四种刺激在脑里产生信息
当遇见一物体,会产生颜色,形状,深度,及运动四种信息。我们会因应物体的位置,速度,方向,作出反应。物体在眼角膜留下影像,物体移动愈快,影像移动愈快。 如果我们要围着某物体旋转,则一定要知道该物体的位置及运动轨迹。
由人类视觉系统的功能可知,人类大脑神经系统具有以下维度的感知
1.三维空间的感知
2.时间维度与速度的感知
3.光波维度与对三种的原色光分别是红,绿及蓝的感知。
这里视觉系统的感知就已经超越了三维空间,而是有了时间的维度,光谱光波的维度。这是五个维度。
人的视觉系统只是人感觉系统的基础。人的感觉还受到人的高级意识、情绪变化的直接控制。
举一个例子,人可以绘画。AI计算机根本不可能进行绘画。因为人类文明中的绘画,是人类灵性的表达。
人类的绘画艺术,就是人的视觉能力与视觉感知的充分展示。每一个画家,他对色彩、空间、时间维度的感知是截然不同的。东方的绘画艺术与西方的绘画艺术有着很大的不同。东方人西方人对同一幅绘画作品,认知、情感、意识范畴可以有很大的不同。
脑严重损伤的的病人,有部分人恢复生活以后,突然爆发了奇特的创造力,就有绘画、音乐、数学的天才能力,这是无法用大脑的学习理论予以说明的,,这是对大脑神经科学研究结论的重大质疑与推翻!
2005年,《神经病学》上报道了一个由突发脑部出血造成的“意外天才”案例:在发病之前,患者对艺术创作没有丝毫兴趣,也没有表现出任何才能。但在患者突发蛛网膜下腔出血后的几周内,他开始“在许多笔记本上写满诗歌,夸张而极具表现力地进行绘画创作,把几乎全部的时间都用来绘画和雕塑。”他不但充满了创作力,而且无法停止手中的创作。他渴望把所有的空间都填满自己的作品,这已经成了一种强迫症。他画满了家里所有的地板、墙砖、天花板,他疯狂的在所有能够绘画的地方创作,不仅仅用画笔和颜料,甚至用蜡油和烟火——这种疯狂最终让他的妻子无法忍受,离他而去。
大量的纪录片对这位叫做汤米·麦克休(Tommy McHugh)的获得型学者症的故事进行了报道。其中《我天才的大脑》对这位患者的生活片段进行了生动详细的描述。
Tommy McHugh,一次几乎致命的脑部出血使他成为了具有狂热创造力的画家。图片来源:《我天才的大脑》
与之前所提到的情况不同,他仅有轻微的前额叶异常,依然具有正常的智商,记忆和语言能力也几乎没有受损。神经学家爱丽丝·弗莱厄蒂(Alice
Flaherty)认为,麦克休在发生出血后,淤血集中在左脑的某个区域,抑制了两个关键脑区的功能,最终引发了他的创造力大爆炸。这两个脑区分别是负责思考决策的前额叶,以及控制语言的颞叶。麦克休发生出血的区域正好在这两个脑区之间,于是形成了一种新的平衡,这种万里挑一的运气,说是“奇迹”也丝毫不为过。他的创作已经持续了六年有余,狂热的创造欲望也许还会持续下去。
还有一个大众都知道的例子,就是梵高。
梵高的《星夜》好在哪里?https://www.zhihu.com/question/21660603
匿名用户
亦何欢、虫虫 、余北溟 等 3271 人赞同了该回答
说来惭愧,真正意识到梵高的伟大是在自己得了精神疾病以后。虽然以前去过好几个收录了梵高作品的博物馆,却没有感受到强烈的冲击。直到后来得了严重的抑郁症,每天需要吃药才有感触。有一个夏天的晚上吃完某种安定情绪的药物后产生了幻觉,当我看到窗外稀疏的星星时,星星就像《星空》中的一样旋转跳跃起来,甚至涌向我。第一时间我想到了梵高,感动得留下了眼泪,由于吃药我已经很久没有哭了。这种感觉不是悲伤也不是孤独,而是理解。世界上形形色色的人当中总有一些孤独的灵魂,而孤独的灵魂也可以有强烈的共鸣,虽然我们不是一个时代的人。
知乎这一段回答,说出了绘画艺术的本质。绘画就是人类灵魂内容、意识思想表达一种很好的方式。
追溯到4万年前法国岩洞的智人岩画的内容,与4万年以后梵高、汤米·麦克休Tommy McHugh绘画表达的情感内容,梵高、汤米·麦克休对于色彩的运用与4万年前的智人有基本一致的要素。
肖维岩洞中共有1000多幅壁画,可追溯到3.6万年前的石器时代,它们被认为是欧洲最早的人类文化形式。(网页截图)
这就可以下结论,绘画表达的人类意识内容,首先是跨越时间与空间。
梵高是在精神病发作以后,才创作了最伟大的作品。
汤米·麦克休Tommy McHugh是大脑严重创伤以后,没有学过绘画的他,突然具有狂热创造力,他不但充满了创作力,而且无法停止手中的创作。他渴望把所有的空间都填满自己的作品,这已经成了一种强迫症。他画满了家里所有的地板、墙砖、天花板,他疯狂的在所有能够绘画的地方创作,不仅仅用画笔和颜料,甚至用蜡油和烟火。
这不是告知大众,绘画的天赋不是仅仅通过学习就可以得到。绘画,是人类视觉系统对于三维空间,时间的维度,光谱光波维度五个维度综合感知。
在大脑发生病变引发神经疾病,大脑严重损伤的情况下,按照牛顿经典世界脑科学理论,人的视觉系统受到了严重损害,人类应该不再具有正常的三维空间、色彩光波、时间运动的感知能力,而且大多数情况下,经典世界的脑科学是正确的,现在大脑受到严重损害丧失正常视觉功能的情况,属于绝大多数。
但是汤米·麦克休Tommy McHugh绘画天赋是脑损伤以后才具有的,属于后天学者症候群。
后天学者症候群(Savant-Syndrome)是指有认知障碍,但在某一方面,如对某种艺术或学术,却有超乎常人的能力的人。自闭患者中有10%是学者症候群(故称自闭学者,Autistic savant),大脑损伤患者中则约1/2000的机率是。(50%
自闭症患者, 50%大脑损伤患者)。
他们的IQ大部分低于70,但在一些特殊测试中却远胜于常人,故俗称为白痴天才(Idiot Savant)。他们的天赋有多种不同的形式,有演奏乐器、绘画、记忆、计算及日历运算能力。美国电影《雨人》中的“雨人”就是一个典型的学者症候群,他对数字的计算能力和记忆力非常惊人。
后天性学者症候群指儿童或成年人在左脑受损后,突然间发展出的学者症候群患者特殊才能。学者症候群指个人存在严重的智力障碍、自闭症或其他心理疾病,却拥有与其障碍全然相对的、不协调且惊人的某种能力。后天性学者症候群患者一般头部曾受创伤,之后出现超凡的数学、音乐或艺术才能。
传统的脑科学,把此现象归于大脑的可塑性,是没有说服力的。
xiaozongpeng
发表于 2021-12-16 07:19
机器学习是用数据或经验实现计算机算法性能的自动改进,目前涵盖概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科,可以应用到数据挖掘、计算机视觉、自然语言处理、生物特征识别等诸多领域。虽然目前在图像处理应用中使用很广泛,但机器学习的潜力远远不止于此,英特尔有针对机器学习优化的软硬件产品,愿和大家一起努力,让 AI 不断改进我们的日常生活。你的未来,随AI而来。
Ylisar
发表于 2021-12-16 07:27
图像处理,就像Photoshop,里边具备很多对图像处理的功能,比如锐化,模糊之类的。
机器学习,就像一个人,他可以学会很多东西,不只是图像处理,也可能是语音识别等等。
当然这只是一个比喻,图像处理领域还包括一些图像分类的方法,比如SVM,AdaBoost等等,还包括一些分割、滤波、增强、修复等方法。在计算机处理领域来说,上边的这些方法都习惯叫传统方法了,将机器学习结合到图像处理中叫做“新方法”,或者叫做“基于机器学习的图像处理”,这么叫的主要原因是,神经网络火起来之后,特别是CNN出来之后,解决了传统出现处理算法的瓶颈问题,很大程度的提高了图像处理问题在一些标准数据集上的准确度,所以现在越来越多的人开始使用机器学习的方法来做图像处理,当然,目前来说效果还是很好的。
另外看到有人疑惑“计算机视觉”又是什么,我的理解就是,计算机视觉就是让计算机“看”的学科。其实就是利用图像处理,机器学习等技术,去“解释”摄像头获取的图片(视频)数据。或者通俗点说,就比如说,把图片分割,并标记出来每一个区域是什么东西。还有一种类似的情况,就是在工业上使用的,利用摄像头检测产品缺陷之类的,这一类的内容,一般习惯叫做“机器视觉”。
同样用一个比喻来形容计算机视觉,就像一个机器人,通过摄像头获取周围的图像数据,然后通过算法,让它像人一样理解周围的事物。
acecase
发表于 2021-12-16 07:30
图像处理的输入是图像,输出也是图像;
机器学习的输入是知识,输出也是知识;
图像可以作为机器学习的输入,所以图像处理可以是机器学习的某个环节,如,将经过滤波、边缘提取后的图像作为机器学习的输入;
机器学习的输出也可能作为图像处理的一个手段,如,基于机器学习的图像轮廓提取。
注:前两句的比喻,也是从知乎看来的,找不到链接了,侵删。