找回密码
 立即注册
查看: 397|回复: 6

对图象进行二值化处理的意义?

[复制链接]
发表于 2021-7-15 07:26 | 显示全部楼层 |阅读模式
为什么说对图象二值化是后续图象处理技术的基础?我们对一幅图象进行二值化的目的是什么?
发表于 2021-7-15 07:27 | 显示全部楼层
其实图像二值化的方法有不下二十种。一般分为Global和Local两类,区别就是寻找那个阈值的时候使用到了哪里的信息。

具体方法参考下面两个链接:
Auto Threshold
Auto Local Threshold

图像的二值化是最简单的图像处理技术,它一般都跟具体算法联系在一起,很多算法的输入需要是二值数据。比如你把图像文字转换为PDF文字,PDF上只能是黑白两种颜色。比如你给二维码解码,你需要知道哪块黑哪块白。

去掉图像两个字,二值化在视觉里面应用场景多一些。比如早期的人脸检测很多手势识别的方法,第一步要找到皮肤块,所以需要把图像分为皮肤区域和非皮肤区域,这也算是一种二值化,但通常在方法上用的可能不是基于直方图的了(可能是ID3, 随机森林,SVM,甚至神经网络)。比如Haar特征,以及后来的BRIEF和FAST等,还有LBP实际上都是用到二值的思想。

图像二值化可以看作是聚类,可以看作是分类……这些其实不重要,重要的是它快。它最明显的意义就是简化后期的处理,提高处理的速度。

但是单一的图像二值化方法(指基于直方图的二值化)往往比不过其他的方法,因为,毕竟你信息丢了太多。但是二值化快啊……你可以进行一百次不同的二值化,然后再得到一个更好的结果……
发表于 2021-7-15 07:34 | 显示全部楼层
一般是为了将感兴趣目标和背景分离。
发表于 2021-7-15 07:37 | 显示全部楼层
为什么说对图象二值化是后续图象处理技术的基础?
这应该是对早期的图像处理而言,现在很多的图像处理算法都是直接在灰度图像上做。

我们对一幅图象进行二值化的目的是什么?
图像的二值化,就是将图像上的像素点的灰度值设置为0或255。 从【0,255】256个灰度级强制减少到只有{0, 255}2个灰度级, 所以二值化的过程是个图片信息丢失非常严重的过程,这其实并不是我们想要的。但是在早期,受限于硬件性能的约束,直接在灰度图像上处理,时间还难以接受,而在二值化图像上做图像处理速度可以大大降低,所以说图象二值化是后续图象处理技术的基础。
发表于 2021-7-15 07:37 | 显示全部楼层
占个坑,
很多处理方法都是为了后续处理和识别进行的。图像的二值化处理就是一个重要的前期图像处理。举个我做的工作,我在做二维码识别算法的探究时,首先对采集的图像进行平滑处理,就是降低噪点。然后对图像进行二值化处理,由于识别精度有要求,我是用了区域阀值,二值化需要一个阀值,区域阀值就是参考该像素点给定窗口大小内像素的均值,可以用卷积的方法去实现。使用二值化处理的原因是,因为我要识别二维码,而二维码是由“0”和“1”两种信息构成的,而我们采集的图像一般是256灰度分辨率的(灰度图像),为了方便识别,把图像中介于0到255之间的值划分为0或255是为了方便后续的识别。在很多识别领域,二值处理比较重要。
发表于 2021-7-15 07:41 | 显示全部楼层
今天刚遇到文本扫描的问题,了解了一下:
楼上各位提到了各种细节:

常见用途: 文档 OCR ;识别体的特征化:路径识别,脸部识别,指纹识别;
研究方向:光照紊乱?复杂背景?混合图文?各式排版?按需轮廓分离形式:比如简化一副复杂的画成为可以看得清主要内容的黑白画(或蒙版)? ,嗯还有码图识别。

网上有很多研究公布,可参考

有助思想:如何确定局部区域
发表于 2021-7-15 07:50 | 显示全部楼层
区分前景背景,或者得到感兴趣部分。降维。
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2025-1-17 02:55 , Processed in 0.100326 second(s), 25 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表