学习图像措置怎么学？

evercrete · 发表于 2024-7-15 17:22

学习图像措置怎么学？

茫茫雨 · 发表于 2024-7-15 17:22

部分思维导图

图像数字化技术

对于连续形式的模拟图像，先要进行离散化，转换为数字图像。图像的数字化包括采样和量化两个过程。
设连续图像f(x，y)经数字化后，可以用一个离散量组成的矩阵g(i，j)(即二维数组)来表示：

矩阵中的每一个元素称为像元、像素或图像元素。而g( i, j )代表(i, j )点的灰度值，即亮度值。

(1)g(i，j)代表该点图像的光强度，g(i，j)必须大于零，且为有限值，即0<g(i，j)<∞。
(2)数字化采样一般是按正方形点阵采样的，除此之外还有三角形点阵、正六边形点阵采样方式。
(3)用g(i，j)的数值来表示(i，j)位置点上灰度值的大小，只反映了黑白灰度的关系。
(4)如果是一幅彩色图像，各点的数值还应当反映色彩的变化，可用g(i，j，λ)表示，其中λ是波长。
(5)如果图像是运动的，g(i，j)还应是时间 t 的函数，即可表示为g(i，j，λ，t)。

数字图像根据灰度级数的差异可分为：黑白图像、灰度图像和彩色图像。

黑白图像：又名二值图像。每个像素只能是黑或白，像素值为0或1。
灰度图像：每个像素的信息由一个量化的灰度来描述，无彩色信息。像素值范围[0,255]
彩色图像：每个像素由R、G、B分量构成的图像。

采样

图像在空间上的离散化称为采样。也就是用空间上部分点的灰度值代表图像，这些点称为采样点。
对一幅图像采样时，若每行(即横向)像素为M个，每列(即纵向)像素为N个，则图像大小为M×N个像素。

在进行采样时，采样点间隔的选取是一个非常重要的问题，它决定了采样后图像的质量，即忠实于原图像的程度。采样间隔的大小选取要依据原图像的细微浓淡变化来决定。图像中细节越多，采样间隔应越小。
根据一维采样定理，若一维信号g(t)的最大频率为ω，以T≤1/(2ω)为间隔进行采样，则能够根据采样结果g(iT) (i=…，-1，0，1，…)完全恢复g(t)。

采样孔径（即形状）右正方形、长方形、圆形、椭圆形。
量化

模拟图像经过采样后，在空间上离散化为像素。但采样所得的像素值(即灰度值)仍是连续量。把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。
若连续灰度值用z来表示，对于满足zi≤z<zi+1的z值，都量化为整数qi。qi称为像素的灰度值。z与qi的差称为量化误差。
像素值量化后用8 bit来表示，把由黑—灰—白的连续变化的灰度值量化为0～255共256级灰度值

量化示意图

连续灰度值量化为灰度级的方法

等间隔量化
非等间隔量化

等间隔量化，就是简单地把采样值的灰度范围等间隔地分割并进行量化。该方法也称为均匀量化或线性量化。对于像素灰度值在黑—白范围较均匀分布的图像，这种量化方法可以得到较小的量化误差。
为了减小量化误差，另一种是非等间隔量化，即非均匀量化。依据图像灰度值分布的概率密度函数，按总的量化误差最小的原则来进行量化。对图像中像素灰度值频繁出现的灰度值范围，量化间隔取小一些；而对那些像素灰度值极少出现的范围，则量化间隔取大一些。
由于图像灰度值分布的概率密度函数因图像不同而异，所以不可能找到一个适用于各种图像的最佳非等间隔量化方案。因此，实用上一般多采用等间隔量化。
采样与量化参数的选择

采样时的采样点数与量化时每个像素量化的级数，既影响数字图像的质量，也影响到该数字图像数据量的大小。
假定图像取M×N个样点，每个像素量化后的灰度二进制位数为Q，则存储一幅数字图像所需的二进制位数为b=M×N×Q (bit) 。则字节数为 B=b/8(Byte)。
对一幅图像，当量化级数Q一定时，采样点数M×N对图像质量有着显著的影响。采样点数越多，图像质量越好；当采样点数减少时，图像的块状效应就逐渐明显。

不同采样点数对图像质量的影响

同理，当图像的采样点数一定时，采用不同量化级数的图像质量也不一样。量化级数越多，图像质量越好；量化级数越少，图像质量越差。量化级数最小的极端情况就是二值图像，图像出现假轮廓。

不同量化级数对图像质量的影响

当限定数字图像的大小时，采用如下原则，可得到质量较好的图像：

(1) 对缓变的图像，应该细量化、粗采样，以避免假轮廓。
(2) 对细节丰富的图像，应细采样、粗量化，以避免模糊(混叠)。

对于彩色图像，是按照颜色成分—红(R)、绿(G)、蓝(B)分别采样和量化的。若各种颜色成分均按8 bit量化，即每种颜色量级别是256，则可以处理256×256×256 = 16777216种颜色。
图像数字化设备

采样和量化是数字化一幅图像的两个基本过程：

采样：把图像划分为若干图像元素(像素)并给出它们的地址。
量化：度量每一像素的灰度，并把连续的度量结果量化为整数。

图像数字化设备包含以下五个部分：采样孔、图像扫描机构、光传感器、量化器、输出存储装置。
图像数字化设备的性能评价：像素大小、量化位数、图像大小、线性度、噪声。
色度学基础与颜色模型

色度学基础

灰度图像的像素值是光强，即二维空间变量的函数f(x，y)。如果把灰度值看成是二维空间变量和光谱变量的函数f(x，y，λ)，则为多光谱图像，也就是通常所说的彩色图像。
计算机显示一幅彩色图像时，每一个像素的颜色是通过三种基本颜色(红、绿、蓝)合成的，即利用了最常见的RGB颜色模型。
颜色有三个基本属性，分别是色调、饱和度、亮度。基于这三个基本属性，提出了一种重要的颜色模型HSI (Hue，Saturation，Intensity)。
颜色模型

为了科学地定量描述和使用颜色，人们提出了各种颜色模型。目前常用的颜色模型按用途可分为三类：

计算颜色模型：RGB模型、CIE XYZ模型、Lab模型等；
视觉颜色模型：HSI模型、HSV模型和HSL模型等；
工业颜色模型：印刷中用的CMYK模型、电视系统用的YUV模型、用于彩色图像压缩的YCbCr模型等。

RGB模型
RGB模型采用CIE规定的三基色构成表色系统。设颜色传感器把数字图像上的一个像素编码成(R，G，B)，每个分量量化范围为［0，255］共256级。因此，RGB模型可以表示28×28×28=256×256×256=16777 216≈1670万种颜色。
CIE XYZ模型
其中，X、Y、Z分别表示三种标准原色。对于可见光中的任一种颜色F，可以找到一组权值使：

式中： x、y、z称为标准计色系统下的色度坐标。
CIE XYZ模型与RGB模型之间可以相互转换，其转换公式为：

Lab颜色模型
Lab颜色由亮度或光亮度分量L和a、b两个色度分量组成。其中，a在正向的数值越大表示越红，在负向的数值越大则表示越绿；b在正向的数值越大表示越黄，在负向的数值越大表示越蓝。
Lab颜色与设备无关，无论使用何种设备(如显示器、打印机、计算机或扫描仪)创建或输出图像，这种模型都能生成一致的颜色。Lab模型与XYZ模型的转换公式为：

式中： X0、Y0、Z0为标准白色对应的X、Y、Z值。
HSI颜色模型
以色调、饱和度和强度三种基本特征量来感知颜色。

色调H (Hue)：与光波的波长有关，它表示人的感官对不同颜色的感受，如红色、绿色、蓝色等。它也可表示一定范围的颜色，如暖色、冷色等。
饱和度S (Saturation)：表示颜色的纯度，纯光谱色是完全饱和的，加入白光会稀释饱和度。饱和度越大，颜色看起来就会越鲜艳，反之亦然。
强度I (Intensity)：对应成像亮度和图像灰度，是颜色的明亮程度。

HSI模型的建立基于两个重要的事实，这使得HSI模型非常适合彩色特性检测与分析。

① I 分量与图像的彩色信息无关；
②H和S分量与人感受颜色的方式是紧密相联的。

CMY颜色模型
通过颜色相减来产生其它颜色的，所以称这种方式为减色合成法。
CMY模式的原色为青色、品红色、黄色。青色、品红色、黄色是该表色系统的三基色，它们分别对应三种墨水。青色吸收红光，品红色吸收绿光，黄色吸收蓝光，印刷好的图像被白光照射时会产生合适的反射，从而形成不同的色彩。
部分颜色的CMY编码为：白色(0，0，0)、黑色(255，255，255)、黄色(0，0，255)
YUV电视信号彩色坐标系统
彩色电视信号传输时，将RGB改组成亮度信号和色度信号，即YUV信号，其中Y信号表示亮度，U、V信号表示色差。
YCbCr模型
YCbCr模型充分考虑人眼的视觉特性，以降低彩色数字图像存储量，是一种适合于彩色图像压缩的模型。
YCbCr模型与YUV模型一样，由亮度Y、色差Cb、色差Cr构成。与YUV模型不同的是，在构造色差信号时，充分考虑了R、G、B三个分量在视觉感受中的不同重要性。
数字图像类型

位图

线画稿：适合于由黑白两色构成而没有灰度阴影的图像。
灰度图像：只有灰度颜色而没有彩色，是具有从黑到白的256种灰度色域的单色图像。
真彩色图像：每一个像素由红、绿和蓝三个字节组成，每个字节为8 bit，表示0~255之间不同的亮度值。
索引颜色图像：也称为映射颜色。在这种模式下，颜色都是预先定义的，并且可供选用的一组颜色也很有限。索引颜色的图像最多只能显示256种颜色。

相关术语

像素(Pixel)、点(Dot)和样点(Sample)
分辨率：图像分辨率、屏幕分辨率、打印机分辨率、扫描仪分辨率

图像文件格式

BMP图像文件格式

BMP图像的数据由如下四部分组成：

第一部分为位图文件头BITMAPFILEHEADER
第二部分为位图信息头BITMAPINFOHEADER
第三部分为调色板，这是对灰度图像或索引图像而言的。真彩色图像并不需要调色板，其位图信息头部分后直接是位图数据。
第四部分是位图数据。对于用到调色板的位图，位图数据就是该像素颜色在调色板中的索引值；对于真彩色图像，位图数据就是实际的R、G、B值。

其它文件格式

TIF图像文件格式：由文件头、参数指针表与参数域、参数数据表和图像数据4部分组成；
GIF图像文件格式；
PBM、PGM、PPM文件；
PCX文件：文件头、图像数据和256色调色板；
JPEG图像格式：高压缩比和良好的图像质量。

aixn · 发表于 2024-7-15 17:22

1)基础理论是必须的，冈萨雷斯这本是必须先吃透的;2)面向工程的计算机视觉理论和技术，是要掌握的；3）深度学习，虽说现在研发都是各种魔改，但现在也是标配，没有不行；4）技术前沿是一直要跟踪的，看paper; 5)编程技能，C++/python，各种深度学习框架，各种图像处理库，必须伸手就来;6) 针对某一类应用，要有全流程的技术储备，有很多是技术之外，或者不是纯图像处理的，但确实工程化的关键。

iidodo · 发表于 2024-7-15 17:22

1.冈撒蕾丝的《数字图像处理》，第一遍可以简单看一下，了解有哪些图像处理方法就行，不用看具体原理，个把小时应该够了。在csdn等博客网站，MATLAB官方社区等网站搜索相关方法的代码，在MATLAB(会其他语言也可以，MATLAB入门简单，不用专门去学习MATLAB编程之类，要学的东西多了容易放弃)上直接先调用现有的程序运行一遍。比如灰度化，一些简单的滤波，图像增强，阈值分割等。
能得出相应的结果图像之后，恭喜，已经会图像处理了。
2.然后根据《数字图像处理》去看具体原理，结合程序，把程序每一句读懂，顺便MATLAB编程也就学会了，哪句不懂直接复制去搜，也是在博客和一些网站。MATLAB的函数在帮助文档就可以搜，用法和原理比较详细。还是快速先把数字图像处理先过一遍，以后遇到要用的方法再去仔细研究感觉就行。
3.结合具体项目，学习图像处理肯定有对应目标吧，现在就是根据目标去继续学习。去查找相应方向的国内外论文，能复现的自己编程试一下。
4.论文读的差不多了，方向相关的图像处理方法基本了解有哪些了，就可以自己去想一下创新的东西，比如根据哪个现有的图像处理方法改编，改变后的方法更加适用你的方向，就可以写论文了。
5.后面我也不清楚了，不过我觉得可以学习深度学习这些了，再学习一些编程语言，c++,python等。
6.《数字图像处理》pdf需要的话可以私聊，我有。

		自动登录	找回密码
密码			立即注册

学习图像措置怎么学？

本帖子中包含更多资源