Zephus 发表于 2022-1-12 12:24

数字图像处理

第1、2章 绪论、图象处理的基本概念。
第3、4章 空域和频域变换
第5、8章 图象增强和图象复原。
第6章 图象编码
第7、9章 图象分割和形态学。

第1章 绪论

1.1        从图象到图像工程
图象和数字图象
图象技术和图象工程
相关学科和领域
1.2        图象处理和分析
图象处理和分析系统
图象采集、显示、存储、通讯、处理和分析模块

1.1 从图象到图像工程

1.1.1 图象和数字图象

什么是图象?
        图象(image)是泛指照片、动画等等形成视觉景象的事物。图象与计算机图形学中的图形的区别是:计算机图形学是从建立数学模型到生成图形,而图象通常是指从外界产生的图形。

                客观世界是三维空间,但一般图象是二维的。二维图象在反映三维世界的过程中必然丢失了部分信息。即使是记录下来的信息也可能有失真,甚至于难以识别物体。因此,需要从图象中恢复和重建信息,分析和提取图象的数学模型,以至于形成人们对于图象记录下的事物有正确和深刻的认识。这个过程就成为图象处理过程。
为什么需要数字图象(digital image )?

        普通图象包含的信息量巨大,需要使用计算机对图象进行处理。因此,需要把普通图象转变成计算机能处理的数字图象。现在的数码相机可以直接地把视觉图象变成数字图象。数字图象类似于光栅图形,由有限行和有限列组成。每个基本单元叫做一个象素(pixel)。三维图象的象素又叫做体素(voxel)。通常的二维数字图像是一个矩型,可以用一个二维数组 I(x,y) 来表示,其中 x,y是二维空间中的某坐标系的坐标,I(x,y)表示图像在该点处的灰度值等性质。彩色可以是红绿蓝三个单色的一定灰度值的合成。一般来说,这些坐标和灰度值是实数,不仅依赖于坐标系的选取,而且依赖于灰度值的度量单位。但是,数字计算机只可能表示有限字长的有限个数字。所以必须把灰度值离散化。简单地说,数字图象等同于一个整数值的有限矩阵。数字图像是数字图像处理和分析的对象。

1.1.2 图象技术和图象工程
数字图象处理的简史

        数字图象的产生远在计算机出现之前。最早有电报传输的数字图象。六、七十年代,随着计算机硬件的发展和快速傅立叶变换算法的发现使得用计算机能够处理图象。八十年代开始处理三维图象,九十年代以来,随着计算机性能的大幅提高和广泛使用,图象处理技术已经涉及社会的各个角落。图象逐渐在传播媒体中占据了主导地位,产生的许多的新行业新商机。未来图象处理的发展是不可限量的。数字图象处理属于计算机科学,但是它的90%依赖于数学。从这个特点来看,对于本专业的学生来说,数字图象处理技术是一个十分理想的发展方向。
哪些属于图象技术?        
        图象技术是与图象有关部门的技术的总称。它是一类综合技术工程。它包括图象的采集、获取、编码、存储和传输、图象的生成、显示和输出、图象的变换、增强、恢复和重建、图象的分割、目标的检测、表达和描述、特征的提取、图象的分类、识别、图象模型的建立和匹配、图象和场景的理解。

                狭义的数字图象处理是指图象的增强、恢复和重建,操作的对象是图象的象素,输出的是图象。
什么是图像工程?(广义的数字图像处理)

                它是由图像处理、图像分析和图像理解三个系统所组成。图像处理包括图像采集和从图像到图像的变换,以改善主观的视觉效果和为图像分析和图像理解作初步的处理。图像分析是从图像中取出感兴趣的数据,以描述图像中目标的特点。图像理解是在图像分析的基础上研究各目标的性质和相互关系,以得出图像内容的理解和对原场景的解释。图像处理、图像分析和图像理解是处在从低到高的三个不同的抽象程度上的过程。本课程着重于图像处理和分析系统。

1.1.3 相关学科和领域
图象工程是一门系统地研究各种图象理论、技术和应用的交叉学科。

                从它的研究方法看,它与数学、物理学、生物学、心理学、电子学、计算机科学可以互相借鉴,从它的研究范围看,它与模式识别、计算机视觉、计算机图形学等学科交叉。
1.2 图象处理和分析

1.2.1 图象处理和分析系统
        图像处理和分析系统包括如下模块:图像采集模块、图像显示模块、图像存储模块、图像通讯模块和图像处理和分析模块。
1.2.2 模块
图象采集模块        CCD
图象显示模块        CRT,LCD
图象存储模块        内存、帧缓存、硬盘
图象通讯模块       LAN、WAN
图象处理和分析模块


图象文件的数据结构
一个完整的图象处理程序的基本功能有:打开图象文件、显示图象、对图象文件进行指定的处理、存储图象文件。由于图象文件比较大,通常需要在储存前进行压缩。所以打开和存储图象文件涉及到文件的格式。

图象文件的格式
        图像文件指包含图像数据的文件。文件内除图像数据本身以外,一般还有图像的描述信息,以便图像的读取和显示。表示图像常用矢量形式或光栅形式。

                矢量形式中图像用一系列线段或线段的组合体来表示,线段的灰度可以不同,组合体的各部分可用不同的灰度来填充。矢量形式文件中有一系列的命令和数据,执行的结果是画出图像来。
                图像数据文件主要是用光栅形式,即图像是一些图像点的集合,比较适合变化复杂的图像。它的主要缺点是缺少对象和像素点之间的联系,且在伸缩图像的过程中图像会改变。例如,常见的图象文件类型有bmp,jpg等等。图象处理的程序必须考虑图象文件的格式,否则无法正确地打开和保存图象文件。
       pgm格式

        美国的许多大学用pgm格式,避免使用压缩文件格式,对初学者来说是很方便的。下面是一幅该格式的图象。

补充:图象和视觉基础
2.1 概论和综述
2.2 人眼与亮度视觉
2.3 颜色视觉
2.4 光度学和成象模型
2.5 成象变换
2.6 采样和量化
2.7 象素间联系
2.8 算术和逻辑运算
2.9 坐标变换

第2章 图象和视觉基础

2.1 概论和综述
该基础包括视觉基础、成像基础和图像基础三部分:
视觉基础(人眼与亮度视觉,颜色视觉)
成像基础(模型、几何和采样量化)
图像基础(像素间联系、图像运算和图像坐标变换)
注意:

视觉:指光对感官的刺激和视觉系统的感觉。
视知觉:指如何通过视觉形成关于外部世界的表象。

2.2 人眼与亮度视觉

2.2.1 人眼成象
        人的眼球是一个复杂的视觉器官。眼球的前部有晶状体,相当于照相机的镜头。眼球内侧的后部有视网膜。视网膜表面分布着两种感光细胞:锥细胞和柱细胞。眼内有六、七百万的锥细胞,它们对明亮的光和颜色很敏感。人眼借助于锥细胞来区分细节,因为每个锥细胞都连到神经末梢。锥细胞的视觉称为适亮视觉。眼内有75万到150万柱细胞。它们分布面大,且几个柱细胞连到一个神经末稍。分辨率低,主要提供整体视觉印象。虽然它们对颜色不敏感,但是对弱光较敏感。柱细胞的视觉称为适暗视觉。

                视网膜的中心是中央凹,面积约1.51.5mm2,锥细胞的密度达到150000个/mm2,是眼内最敏感的区域。

2.3 采样和量化
一幅图像需要经过离散化成为数字图像后才能被计算机处理。图像的空间坐标的离散化叫做空间采样,灰度的离散化叫做灰度量化。采样分为均匀采样和量化和非均匀采样和量化。假设图像是一个长方形。在平面上取MN个大小相同的网格,并把灰度分成G个等级。取各网格中的某点处的灰度值最接近的整数作为该网格的灰度。通常,取M=2m, N=2n和G=2k。则存储一幅图像的需要的位数等于b=MNk。例如,一幅128128、64个灰度等级的图像需要220位,512512、256个灰度等级的图像需要226位。采样的个数和灰度等级的选取与分辨率和储存的能力两者有关,需要综合考虑。例如:
图像空间分辨率变化产生的效果。
图像灰度分辨率变化产生的效果。
图像空间和灰度分辨率同时变化产生的效果。


非均匀采样和量化
对给定的空间分辨率,图像的质量可以根据图像特性利用自适应的采样过程来改进。例如,在灰度变化显著的有很多细节的区域应当采用较密的采样。又例如,可以计算所有灰度值出现的频率。若某范围内的灰度值出现频繁,而在其他范围内灰度值出现较稀,则在该范围内量化灰度就要较密,在其他范围内较稀。

算术和逻辑运算

图像的四则运算中是逐个像点进行的。加法常用来去除噪音,减法常用在医学成像,乘除法常用来矫正图像中的灰度阴影。

        常用的逻辑运算有
        (1)与(AND)
        (2)或(OR)
        (3)补(NOT)

        以上运算既可用于整幅图像的运算,也可以用于邻域运算。例如,一点及其8-邻域的算术平均作为该点的新值。现在常用算术和逻辑运算的单元ALU来加速运算。

第3章 象素空间关系
图象是由象素组成。图象以象素为单位建立坐标系。通常是x轴向左,y轴向下。
图象的坐标变换就是象素的坐标变换。所谓空间变换就是把象素从一个空间变换到另一个空间的坐标变换。

坐标变换的一个应用是对图象的几何失真进行校正。

3.1 象素间联系
一个象素的邻域是指该象素周围的象素集合。
一个象素p的周围有八个象素,它们共同组成了该象素的8-邻域N8(p) 。一个象素与上下左右的四个象素组成了4-邻域N4(p)。一个象素与四个角上的象素组成了对角邻域ND(p)。
同类灰度的象素间的邻接,连接和连通问题:
两个象素彼此落在对方的4-邻域内,称为4-连接
两个象素彼此落在对方的8-邻域内,称为8-连接

如果两个象素或者是4-连接,或者不是4-连接但落在对方的对角邻域ND(p)内,那么称为混合连接(m-连接)
混合连接可以避免8-连接造成的多路问题。

两个象素集合的连通是指它们在指定的邻域内有一条通路
第4章 空域增强技术

图象增强技术是使图象的某种指定效果更好。例如,使X透视照片更清晰。
分成两大类:空域增强技术和频域增强技术。其中,空域指象素组成的空间。
空域增强技术直接作用于象素。可以表示为
                g(x,y) = EH(f(x,y))

        其中f和g分别是增强前后的图象.这个变换不改变象素的位置,仅改变象素的灰度f(x,y)。
4.1空间技术分类

如果变换EH仅用一个点,称EH为点运算(点处理)。如果变换EH还用到点(x,y)邻域内的点,那么记变换EH为        g(x,y)=EH(f(x,y),n),
        称为模板处理。
点操作可以分为灰度操作和集合操作,它们仅根据该点的灰度和位置,分别改变原灰度为新灰度(称为灰度变换或灰度映射)和原位置为新位置的象素.

灰度操作可以把不同的灰度变成同一个灰度,集合操作可以把不同位置变成同一个位置.因此,它们可能不是可逆的变换.

线性滤波器
技术分类和实现原理
技术分类 根据功能分成平滑滤波和锐化滤波。
        平滑滤波减弱和消除高频分量,使图象灰度平滑。
        锐化滤波减弱和消除低频分量,是图象反差增大。

2.模板卷积
方形模板在图象中漫游,中心对准一个象素。


非线性滤波
分成三个发展方向:逻辑、几何和代数,分别基于集合、形状和排序。下面介绍基于排序的方向。
4.6.1 非线性平滑滤波器
1-D中值滤波原理
非线性、基于模板。设模板尺寸M=2r+1,r为半径。
给定一维信号{fi}, I=1,2,…,N.则中值滤波的输出为
        gj = 数组fj-r,fj-r+1,…,f0,…,fj+r-1,fj+r的中值。
其中,fj的下标在0到N之间。这意味着对该数组排序,然后
输出一个数, 使它既不大于又不小于其中的r+1个数。
中值滤波能完全消除孤立的脉冲(零脉冲响应)和不影响理想的阶跃响应。

能被中值滤波完全除去的脉冲的最大长度依赖于滤波器的模板长度M。

局部增强
对图象的一部分进行增强
例如,
将图象分成一系列子图象,并对子图象进行直方图等操作
利用局部的均值m和均方差
        g(x,y) = A(x,y)+m(x,y),
其中,A(x,y=kM/(x,y)称为局部增益函数,M为平均灰度,k为比例系数.g(x,y)右边的第一项能放大图象的局部变化,第二项恢复均值.
*********************************************
*********************************************************************
*********************************************************************************
页: [1]
查看完整版本: 数字图像处理