数字图像处理必备基本知识总结

freshveg · 发表于 2023-3-21 07:20

前言数字图像处理是计算机视觉的重要基础，属于必须掌握的内容，这里给大家分享一篇关于数字图像处理基础知识的总结性的文章。

本文转载自公众号小白学视觉
欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。
QQ交流群: 444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。
基础知识

1、数字图像：
数字图像，又称为数码图像或数位图像，是二维图像用有限数字数值像素的表示。数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。

2、数字图像处理包括内容：
图像数字化；图像变换；图像增强；图像恢复；图像压缩编码；图像分割；图像分析与描述；图像的识别分类。

3、数字图像处理系统包括部分：
输入（采集）；存储；输出（显示）；通信；图像处理与分析。

4、从“模拟图像”到“数字图像”要经过的步骤有：
图像信息的获取；图像信息的存储；图像信息处理；图像信息的传输；图像信息的输出和显示。

5、数字图像1600x1200什么意思？灰度一般取值范围0~255，其含义是什么？
数字图像1600x1200表示空间分辨率为1600x1200像素；灰度范围0~255指示图像的256阶灰阶，就是通过不同程度的灰色来来表示图像的明暗关系，8bit的灰度分辨率。

6、图像的数字化包括哪两个过程？它们对数字化图像质量有何影响？
采样；量化
采样是将空间上连续的图像变换成离散的点，采样频率越高，还原的图像越真实。量化是将采样出来的像素点转换成离散的数量值，一幅数字图像中不同灰度值的个数称为灰度等级，级数越大，图像越是清晰。

7、数字化图像的数据量与哪些因素有关？
图像分辨率；采样率；采样值

8、什么是灰度直方图？它有哪些应用？从灰度直方图中你可可以获得哪些信息？
灰度直方图反映的是一幅图像中各灰度级像素出现的频率之间的关系
它可以用于：判断图像量化是否恰当；确定图像二值化的阈值；计算图像中物体的面积；计算图像信息量。
从灰度直方图中你可可以获得：
暗图像对应的直方图组成成分几种在灰度值较小的左边一侧
明亮的图像的直方图则倾向于灰度值较大的右边一侧
对比度较低的图像对应的直方图窄而集中于灰度级的中部
对比度高的图像对应的直方图分布范围很宽而且分布均匀
9、什么是点处理？你所学算法中哪些属于点处理？
在局部处理中，输出值仅与像素灰度有关的处理称为点处理。如：图像对比图增强，图像二值化。

10、什么是局部处理？你所学算法中哪些属于局部处理？
在对输入图像进行处理时，计算某一输出像素值由输入图像像素的小领域中的像素值确定，这种处理称为局部处理。如：图像的移动平均平滑法，空间域锐化法。

图像增强/空域

11、图像增强的目的是什么？
图像增强的目的是要改善图像的视觉效果，针对给定图像的应用场合，有目的的增强图像的整体或局部特性，将原来不清晰的图像变得清晰或增强某些感兴趣的特征，扩大图像中不同物体的特征之间的差别，抑制不感兴趣的特征，使之改善图像质量、丰富信息量，将强图像判读和识别效果，满足某些特征分析的需求。

12、什么是灰度图像的直方图？简述用它可以简单判断图像质量？
灰度直方图定义为数字图像中各灰度级与其出现的频数间的统计关系，它能描述该图像的概貌，例如图像的灰度范围，每个灰度级出现的频率，灰度级的分布，整幅图像的平均明暗和对比度等

13、常用图像增强方法有哪些？
图像的线性变换；图像的非线性变化；图像的直方图均衡化和规定化。

14、“平均模板”对图像做哪种处理？写出 3x3和5x5“平均模板”？
抑制噪声，改善图像质量

15、“中值滤波”对图像做哪种处理？是如何运算的？
中值滤波是对一个滑动窗口内的诸像素灰度值排序，用其中值代替窗口中心像素的灰度
值的滤波方法，它是一种非线性的平滑法，对脉冲干扰及椒盐噪声的抑制效果好，在抑
制随机噪声的同时能有效保护边缘少受模糊。
16、什么叫点处理、局部处理、全局处理？3x3平均模板、直方图修正、灰度反转各属于哪种处理？
点处理：输出值仅与像素灰度有关的处理称为点处理。（直方图修正）
局部处理：计算某一输出像素值由输入图像像素的小领域中的像素值确定，这种处理称为局部处理。（灰度反转）
全局处理：图像某一像素灰度的变化与图像全部像素灰度值有关。（3x3平均模板）

图像变换/频域处理

17、常用图像变换算法：
图像的几何变换（图像畸变校正、图像缩放：双线性插值、旋转、拼接）
图像变换（傅立叶、余弦、沃尔什－哈达玛、K-L变换、小波变换）
图像频域处理（增强算法：高频率提升、同态滤波；平滑去噪：低通滤波）
18、为什么要进行图像变换？各种变换应用在图像什么处理上？
图像变换在数字图像处理与分析中起着很重要的作用，是一种常用的、有效的分析手段。图像变换的目的在于：使图像处理问题化；有利于图像特征提取；有助于从概念上增强对图像信息的理解。
19、简述空域滤波跟频域滤波的不同
空域法：直接对图像的像素灰度进行操作。常用算法：图像的灰度变换；直方图修正（均衡化、规定化）；平滑和锐化处理；彩色增强。
频域法：在图像的变换域中，对图像的变换值进行操作，然后经逆变换获得所需要的增强结果。常用算法：低通滤波；高频提升滤波；同态滤波。
20、频域进行图像增强、去噪、边缘检测分别用哪种滤波器？
增强————同态滤波器
去噪————低通滤波器
边缘检测——高通滤波器
21、频域处理图像的步骤：
a.清除噪声，改善图像的视觉效果
b.突出边缘有利于识别和处理

图像复原

常用图像变换算法：
（1）逆滤波；（2）维纳滤波（Wiener Filter）；（3）盲卷积
22、什么叫图像复原？与图像增强有什么区别？
图像在形成、传输和记录中，由于成像系统、传输介质和设备的不完善，导致图像质量下降，这一现象称为图像退化。
图像复原和图像增强是有区别的，虽然二者的目的都是为了改善图像的质量，但图像增强不考虑图像是如何退化的，只通过试探各种技术来来增强图像的视觉效果。因此，图像增强可以不顾增强后的图像是否失真，只要看着舒服就行。而图像复原则完全不同，需知道图像退化的机制和过程等先验知识，据此找出一种相应的逆过程解算方法，从而得到复原的图像。如果图像已退化，应先做复原处理，再做增强处理。
23、说出几种图像退化：
图像模糊、失真、有噪声等
24、什么是维纳滤波器？
是一种以最小平方为最优准则的线性滤波器，在一定的约束条件下，其输出与给定函数的差的平方达到最小，通过数学运算最终可变为可变为一个拖布列兹方程的求解问题，是利用平稳随机过程的相关特性和频谱特性混有噪声的信号进行滤波。
25、说出几种常用的图像复原方法？
代数恢复方法：无约束复原；约束最小二乘法
频域恢复方法：逆滤波恢复法；去除由均匀运动引起的模糊；维纳滤波复原法

图像压缩编码

常用图像变换算法：
（1）哈夫曼编码；（2）算术编码；（3）预测编码；（4）变换编码
26、图像为什么可以压缩？（即数字图像中存在哪几种冗余？）
图像数据之所以可以被压缩，是因为数据中存在着冗余。在图像压缩中，有三种基本的数据冗余：编码冗余；像素间冗余；视觉冗余。
27、什么是有损和无损压缩？
无损压缩：是对文件本身的压缩，和其它数据文件的压缩一样，是对文件的数据存储方式进行优化，采用某种算法表示重复的数据信息，文件可以完全还原，不影响文件内容，对于数字图像而言，也不会使图像细节有任何损失。
有损压缩：是对图像本身的改变，在保存图像时保留了较多的亮度信息，而将色相和色纯度的信息和周围的像素进行合并，合并的比例不同，压缩的比例也不同，由于信息量减少了，所以压缩比可以很高，图像质量也会相应的下降。
28、霍夫曼编码算法的基本思想是什么？
是根据源数据符号发生的概率进行编码的。在源数据中出现概率越大的符号，分配的码字越短；出现概率越小的信号，其码长越长，从而达到用尽可能少的码表示源数据。
29、损和有损预测编码算法不同之处？各在哪个环节对数据实现了压缩？
无损（亦称无失真、无误差、信息保持）编码中删除的仅仅是图像数据中冗余的数据，经解码重建的图像和原始图像没有任何失真。
有损（亦称有误差、有失真）编码是指解码重建的图像与原图像相比有失真，不能精确的复原，但视觉效果上基本相同，是实现高压缩比的编码方式。
30、简述统计编码、算术编码、预测编码、变换编码算法的基本原理
统计编码：根据信源的概率分布可变长码，使平均码长非常接近于熵。
算数编码：利用编码符号的联合概率，用一个单独的浮点数来代替一串输入符号。
预测编码：不是直接对信号编码，而是对图像预测误差编码。实质上是对新的信息进行编码，以消除相邻像素之间的相关性和冗余性。
变换编码算法：是通过正交变换把图像从空间域转化为能量比较集中的变换域系数，然后对变换系数经行编码，从而达到压缩数据的目的。

图像边缘检测、分割

图像处理常用算法：
（1）边缘检测：Canny 算子、Laplacian算子、Sobel 算子
（2）Hough变换检测直线和圆算法
（3）图像分割：阈值分割算（也叫二值化）、区域分割算法：区域生长法、分裂合并法、空间聚类法。
31、说出几个常用的边缘检测算子：
Canny 算子、Laplacian算子、Sobel 算子
32、分别说出下面四种模板分别实现平滑去噪（低通滤波器）、图像锐化（梯度法）、边缘检测（高通滤波器）哪种处理？

附加：
1、灰度图像跟彩色图像：
灰度图像：是一个二维的灰度（亮度）函数f(x,y)
彩色图像：由三个二维灰度函数f(x,y)组成。三个是RGB或者HSV

2、图像处理：
从图像到图像：从图像到经过加工的另一图像
一个决策：将一幅图像转化为一种非图像的表示

3、相邻像素：
四邻域：

4、像素的连接、邻接、与连通
邻接adjacency：仅考虑像素间的空间关系
由像素间的度量关系知：
四领域也可以定义为：

八领域也可以定义为：

连接connectivity：
空间关系：满足邻接
灰度关系：灰度值是否满足某个特定的相似准则，用V来表示这个准则。

4-连接：2个像素p和r在V中取值且r在p的4邻域中
8-连接：2个像素p和r在V中取值且r在p的8邻域中
m-连接（混合连接）：2个像素 p 和 r 在V 中取值，且满足下面条件之一即可
1、r在p的4领域中。
2、r在p的对角领域中且p的4领域与r的4邻域的交集是空集。如下图所示：eg:彩色图像中左边是m-连接，右边不是。

5、像素间的距离
3个像素p，q，r，分别具有坐标(x, y)，(s, t)，(u, v)，度量函数记为D。
像素间距离的性质：
1>D(p,q)>=0 两个像素之间的距离总是正的
2>D(p,q)=D(q,p) 距离与起终点的选择无关
3>D(p,R)<=D(p,q)+D(q,r) 最短距离是沿直线的
距离度量函数：
1>欧氏距离：距离p小于或者等于某一值是：以p为原点的圆

2>城市街区距离：距离小于或者等于某一值是以p为中心的菱形

3>棋盘距离：距离p小于或者等于某一值是以p为中心的正方形

欢迎关注公众号 CV技术指南 ，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。
QQ交流群: 444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。
其它文章

关于快速学习一项新技术或新领域的一些个人思维习惯与思想总结
计算机视觉中的神经网络可视化工具与项目总结
CV技术指南文章汇总
论文的科学写作与哲学
计算机视觉中的传统特征提取方法总结
Pytorch 数据流中常见Trick总结
计算机视觉中的transformer模型创新思路总结
PNNX: PyTorch 神经网络交换格式
论文创新的常见思路总结
卷积神经网络压缩方法总结
神经网络超参数的调参方法总结
数据增强方法总结
Batch Size对神经网络训练的影响
计算机视觉入门路线
论文创新的常见思路总结
池化技术总结
归一化方法总结
欠拟合与过拟合技术总结
注意力机制技术总结
特征金字塔技术总结
2021-视频监控中的多目标跟踪综述
一文概括机器视觉常用算法以及常用开发库
统一视角理解目标检测算法：最新进展分析与总结
给模型加入先验知识的常见方法总结
谈CV领域审稿
全面理解目标检测中的anchor
实例分割综述总结综合整理版
视频目标检测与图像目标检测的区别
视频理解综述：动作识别、时序动作定位、视频Embedding
资源分享 | SAHI：超大图片中对小目标检测的切片辅助超推理库

Baste · 发表于 2023-3-21 07:23

fwalker · 发表于 2023-3-21 07:26

[赞同][赞同][大笑][大笑][大笑]

IT圈老男孩1 · 发表于 2023-3-21 07:35

所以数字图像是一个矩阵吗

unityloverz · 发表于 2023-3-21 07:45

		自动登录	找回密码
密码			立即注册

数字图像处理必备基本知识总结

本帖子中包含更多资源