gfsdfg吧
② 图像处理的常用方法有哪几个
1、图像变换:
由于图像阵列比较大,如果直接在空间域中进行图像处理,这样涉及的计算量会比较大。因此,我们一般采用各种图像变换的方法,如沃尔什变换、傅立叶变换、离散余弦变换等一些间接处理技术,将空间域的处理转变为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。
2、图像编码压缩:
图像编码压缩技术能够减少描述图像的数据量,从而可以节省图像传输、处理时间和减少所占用的存储器容量。图像编码压缩能够在不失真的基础上获得,同时也可以在允许的失真条件下开始。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
3、图像增强和复原:
图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立“降质模型”,再采用某种滤波方法,恢复或重建原来的图像。
4、图像分割:
图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。
关于图像处理的常用方法,青藤小编就和您分享到这里了。如果您对图片处理、网站设计等有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于平面设计的技巧及素材等内容,可以点击本站的其他文章进行学习。
③ 图像处理的图像分析
从图像中抽取某些有用的度量、数据或信息。目的是得到某种数值结果,而不是产生另一个图像。图像分析的内容和模式识别、人工智能的研究领域有交叉,但图像分析与典型的模式识别有所区别。图像分析不限于把图像中的特定区域按固定数目的类别加以分类,它主要是提供关于被分析图像的一种描述。为此,既要利用模式识别技术,又要利用关于图像内容的知识库,即人工智能中关于知识表达方面的内容。图像分析需要用图像分割方法抽取出图像的特征,然后对图像进行符号化的描述。这种描述不仅能对图像中是否存在某一特定对象作出回答,还能对图像内容作出详细描述。
图像处理的各个内容是互相有联系的。一个实用的图像处理系统往往结合应用几种图像处理技术才能得到所需要的结果。图像数字化是将一个图像变换为适合计算机处理的形式的第一步。图像编码技术可用以传输和存储图像。图像增强和复原可以是图像处理的最后目的,也可以是为进一步的处理作准备。通过图像分割得出的图像特征可以作为最后结果,也可以作为下一步图像分析的基础。
图像匹配、描述和识别对图像进行比较和配准,通过分制提取图像的特征及相互关系,得到图像符号化的描述,再把它同模型比较,以确定其分类。图像匹配试图建立两张图片之间的几何对应关系,度量其类似或不同的程度。匹配用于图片之间或图片与地图之间的配准,例如检测不同时间所拍图片之间景物的变化,找出运动物体的轨迹。
从图像中抽取某些有用的度量、数据或信息称为图像分析。图像分析的基本步骤是把图像分割成一些互不重叠的区域,每一区域是像素的一个连续集,度量它们的性质和关系,最后把得到的图像关系结构和描述景物分类的模型进行比较,以确定其类型。识别或分类的基础是图像的相似度。一种简单的相似度可用区域特征空间中的距离来定义。另一种基于像素值的相似度量是图像函数的相关性。最后一种定义在关系结构上的相似度称为结构相似度。
以图片分析和理解为目的的分割、描述和识别将用于各种自动化的系统,如字符和图形识别、用机器人进行产品的装配和检验、自动军事目标识别和跟踪、指纹识别、X光照片和血样的自动处理等。在这类应用中,往往需综合应用模式识别和计算机视觉等技术,图像处理更多的是作为前置处理而出现的。
多媒体应用的掀起,对图像压缩技术的应用起了很大的推动作用。图像,包括录像带一类动态图像将转为数字图像,并和文字、声音、图形一起存储在计算机内,显示在计算机的屏幕上。它的应用将扩展到教育、培训和娱乐等新的领域。
④ 图像分析的分析过程
如图为一个分级的图像分析过程的模型。图像分析基本上有四个过程。①传感器输入:把实际物景转换为适合计算机处理的表达形式,对于三维物景也是把它转换成二维平面图像进行处理和分析(见图像表示)。②分割:从物景图像中分解出物体和它的组成部分(见图像分割)。组成部分又由图像基元构成。把物景分解成这样一种分级构造,需要应用关于物景中对象的知识。一般可以把分割看成是一个决策过程,它的算法可分为像点技术和区域技术两类。像点技术是用阈值方法对各个像点进行分类,例如通过像点灰度和阈值的比较求出文字图像中的笔划。区域技术是利用纹理、局部地区灰度对比度等特征检出边界、线条、区域等,并用区域生长、合并、分解等技术求出图像的各个组成成分。此外,为了进一步考察图像整体在分割中的作用,还研究出松弛技术等方法。③识别:对图像中分割出来的物体给以相应的名称,如自然物景中的道路、桥梁、建筑物或工业自动装配线上的各种机器零件等。一般可以根据形状和灰度信息用决策理论和结构方法进行分类,也可以构造一系列已知物体的图像模型,把要识别的对象与各个图像模型进行匹配和比较。④解释:用启发式方法或人机交互技术结合识别方法建立物景的分级构造,说明物景中有些什么物体,物体之间存在什么关系。在三维物景的情况下,可以利用物景的各种已知信息和物景中各个对象相互间的制约关系的知识。例如,从二维图像中的灰度阴影、纹理变化、表面轮廓线形状等推断出三维物景的表面走向;也可根据测距资料,或从几个不同角度的二维图像进行景深的计算,得出三维物景的描述和解释。
⑤ 基本图像分析
grayscale image---->灰度图像的意思
了解了图像原理之后,我们就介绍分别有哪些图像的种类,而这些图像又以档案的形式储存在硬盘里面,或者传输于网路之上.
关于档案格式的最主要考量就是压缩的方法,我们介绍压缩的分类与应用上的考量.
数位图像的像素 (1/2)
这是一份所谓 320 x 200 的图,它的“宽度”(Width) 有 320 像素 (pixels),“高度” (Height) 有 200 条线 (lines).
先解释像素 (pixel).一张像这个小丑图的数位图像,其实是由一堆小粒小粒的色彩排出来的.
每一小粒色彩代表一个单一的颜色,这些不同的颜色凑在一起,被我们看到,就在脑袋里产生了意义,因而认出来这是一个化了妆的小丑.
每一小粒色彩,用一个,两个,或三个数来纪录,称为一个“像素”.
数位图像的像素 (2/2)
所谓 320 x 200 的图,就是宽有 320 个像素,高有 200条线 的图,想象那些像素排成一个矩形,总共有 64,000 个像素.
230 x 200 的像素矩形太大了,所以我们故意把它缩小成一张 40 x 25 的图.
如果觉得它太小了看不见,可以放大八倍 (宽和高各放大 8 倍) 来看看.
256 色图
缩小的小丑图是一张‘256 色’图,宽有 40 个像素,高有 25 个像素.每个像素用一个介于 1 和 256 之间的数表示.
256 色图
‘256 色’图的像素代表的不是色彩,而是色彩的编号.以这张小丑图为例,它一共只用到 81 种不同的颜色.
灰阶图 (1/2)
现在展示一张灰阶的小丑图.它的宽度是 320,高度是 200,也就是仍然有 64,000 个像素,但是此时是个‘灰阶’图,每个像素就直接纪录那个位置的灰色亮度.
我们可以观察,这张‘灰阶’图的像素数值与‘256 色’图的像素数值相同,电脑只是将像素的数值解释成‘亮度’,就造成了这张图.
灰阶图 (2/2)
‘灰阶’图不需要另外储存色盘,每个像素直接纪录那个位置的灰色亮度.因为电脑知道,譬如说 64 号亮度的 RGB 亮度就是 (64, 64, 64).为了能够列出像素的数值,我们还是只看那张缩小的黑白版小丑图 .
高彩图
所谓‘高彩’图就是同一张图里面可以显示不超过 65,536 种不同的颜色.很显然地,像小丑图这种总共只有 64,000 个像素的图,不太可能用到这麼多不同的颜色.‘高彩’图的每个像素要用两个数表示,每个数都介于 0 和 255 之间.
…..
全彩图
所谓的‘全彩’图就是同一张图里面可以显示所有可能的色彩,也就是 255 x 255 x 255 共约一千六百万色.很显然地,像小丑图这种总共只有 64,000 个像素的图,根本不可能用到这麼多不同的颜色 (每个像素只代表一个颜色).
…
图像的‘资料量’
所谓图像的‘资料量’就是一张数位图像在记忆体内所占有的空间.
资料量越大的图像,通常在萤幕上看起来越大,色彩也越丰富,但是它占用的记忆体就越多.
视觉上我们认为数位图像有两个维度:宽 (Width) 和高 (Height).
现在要接受一个新的概念:数位图像其实有三个维度:除了宽度和高度之外,还有‘深度’或者‘厚度’.
而数位图像的资料量,就是这三个维度的乘积,也就是体积.
数位图像的深度
决定图像资料量的第三个维度就是选用的色彩丰富程度,术语称作深度 (Depth).
其实深度就是每个像素代表几个数的意思.色彩最单调的就是‘灰阶’图,它的深度是 1.
比‘灰阶’图多一点点色彩的是‘256 色’图,它的深度理论上也是 1,因为每个像素只代表一个数:色盘上的编号.
但是因为含有色盘的关系,经验上我们就说其深度是 1.01.这是一个我不打算讲清楚细节的地方.
‘高彩’图的深度是 2,‘全彩’图的深度是 3.
图像的资料量
一张数位图像的资料量,就是上述宽,高,深所形成的立方体体积,而单位是 Byte (‘字符’或‘位元组’).电脑的术语中,称 1024 Byte 为一个‘千’Byte,记做 KB (kilo-byte);又称 1024 个 KB,或者大约一百万个 Byte 为 MB (mega-byte).
以一张 320 x 200 的‘灰阶’图为例,其资料量就是 320 * 200 * 1 = 64,000 byte 也就是 62.5KB.
以一张 320 x 200 的‘全彩’图为例,其资料量就是 320 * 200 * 3 = 192000 byte 也就是 187.5KB.
档案与压缩
在这张图像,软体和档案之间的关系示意图上,我们看到电脑以‘档案’的形式储存数位图像于磁盘机内,或者传输数位图像于网际网路上.
负责储存或传输的是作业系统 (OS),例如 MS-Windows 98, ME, XP 之类的.
但是负责展现图像的软体,例如 MS-IE,档案总管,ACDsee 或 PhotoImpact 之类的,却要负责把档案内容转换成像素的数值,若是遇到‘256 色’图,还要处理色盘.
压缩比
档案通常不会一五一十地储存像素 (和色盘) 所对应的数值,而是储存经过压缩的像素数值.
压缩的过程其实是按照一种数学函数,把像素的数值按照函数规则映射到另一种数值.
我们使用电脑,应该已经知道每个档案的性质之中,有所谓的‘档案大小’,也是用 Byte 作单位来计量.
压缩之后的数位图像通常会变得比较小,也就是说档案大小应该会小于图像的资料量.变小的比率就是‘压缩比’.
无失真(Lossless)压缩与破坏性(Losssy)压缩 (1/2)
无失真压缩与破坏性压缩 (2/2)
图片格式的压缩法 (1/2)
图片格式的压缩法 (2/2)
图像的呈现
在这个可爱的动画里面,我们提示:是监视器‘跑去拿’VRAM 里面的指示,而不是电脑将指示从 VRAM ‘送给’监视器.监视器每隔一小段时间就去电脑里面拿 VRAM 里面的指示,然后按照只是在萤幕上扫射各种不同的颜色.因为它扫得很快,我们的眼睛因为视觉暂留的关系,就觉得那个画面是静止的.
像素和光点
像素和光点之间的对应,正常的时候是 1 对 1,也就是一个像素就对应一粒光点.让我们重温缩小版的小丑图,当像素与光点是正常地 1:1 的时候,实在是很小,看不见.如果有必要的话,软体可以让一个像素对应更多粒光点,例如 1:64.这就是‘强迫放大’一张图像的效果.虽然图像的画面是放大了,不过一点也没有变得比较清楚.
所谓监视器的‘分辨率’就是每列有几个光点,一共有几列光点.例如 800 x 600 的分辨率就是在监视器上,每列有 800 个光点,一共 600 列.
影像媒体
影像原理
影像格式
数位图像导论
图片JPEG影像类型讨论
图形压缩,解压缩探讨JPEG 原理
图片JPEG影像类型讨论 (1/3)
目前影像压缩的方法有很多种,基本上可以分为“无失真”及“有失真”两类.例如我们常见的PCX ,GIF ,TIFF ,及TGA 等格式就是属于无失真的影像压缩格式.
它们利用传统档案的压缩原理及技术来处理影像压缩,所以压缩前的原始影像与压缩后还原的结果丝毫不差.
至于我们所熟知的 JPEG (Joint Photographic Coding Expert Group) 则是属于有失真的影像压缩格式.
图片JPEG影像类型讨论 (2/3)
JPEG 由国际标准组织(International Organization for Standardization ,简称ISO) 和国际电话电报谘询委员会( International Telegraph and Telephone Consultative Committee ,简称CCITT) 所建立的一个数位影像压缩标准,主要是用于静态影像压缩方面.
JPEC 采用可失真(Lossy) 编码法的概念,利用数位余弦转换法(Discrete Cosine Transform,简称DCT) 将影像资料中较不重要的部份去除,仅保留重要的资讯,以达到高压缩率的目的.
虽然被JPEC 处理后的影像会有失真的现象,但由于JPEG 的失真比例可以利用参数来加以控制;一般而言,当压缩率( 即压缩过后的体积除以原有资料量的结果) 在5% ~15% 之间时,JPEC 依然能保证其适当的影像品质,这是一般无失真压缩法所作不到的.
图片JPEG影像类型讨论 (3/3)
我们将以下图的阳明山风景为例,利用不同的JPEC 压缩参数(PHOTOIMPACT 5.0 渐进式 1024 X 768)来压缩它,其压缩的结果如图二和图三.图二的影像品质与原图十分接近,而压缩率已达65% ;至于图三,其压缩率为25% ,压缩效果良好,但此时影像品质已经有明显的失真了.
JPEG100 原图100%_ 671K
JPEG65 压缩65%_ 341K
JPEG25 压缩25% 261K
JPEG原理 (1/3)
JPEG所根据的原理是:人的眼睛对影像中亮度的变化最为敏感,远远超过对颜色变化的感觉,所以,JPEG储存的,并不是一点一点的颜色,而是亮度及颜色的"变化率".借着变化速率的曲线的还原,来重现大部分的影像,尤其是影像的"感觉".
对大部分JPEG型态的压缩来说,第一步要先将RGB转换成亮度与色度,最常见的是CCIR601格式,也就是所谓Y,Cb,,Cr格式,Y代表亮度,Cb代表蓝色色度,Cr代表红色色度( 也可用U代表Cb, V代表Cr,即所谓YUV格式),转换公式如下:
Y = 0.299R + 0.587G + 0.114B
Cb = 0.1687R – 0.3313G + 0.5B
Cr = 0.5R – 0.4187G – 0.0813B
这是一个不会失真的转换,Y,Cb,Cr还是可以完全转换回R,G,B的.
JPEG原理 (2/3)
由于人眼对亮度远比对色度敏感,所以在压缩和重建影像时,可以用份量较多的Y,而减少Cb 及Cr的份量.
转换后的数值,仍然是一个图点一个图点的格式.必须将相邻近的点合并,透过DCT(Discrete Cosine transform)转换,将点资料转换成"变化速率"的曲线资料,再将这曲线数位化(这就就是造成JPEG失真所在的地方) .
数位化时所用的系数,决定了资料流失量的多寡,及影像品质的好坏,这些被数位化后的资料,还可以再用Huffman或其他编码方式,予以压缩,存成JPEG档案.还原的步骤刚好逆其道而行.
首先,将JPEG资料解压缩,变成变化速率数位曲线,然后使用逆向的DCT转换,重建影像.原本一些低阶的位元,可能无法重现,都用0加以补足.
JPEG原理 (3/3)
由于Y,Cb,Cr的重要性不同,JPEG允许三者各自赋予不同的份量.例如:以一个2x2点矩阵(共4个图点)来说,Y值最好有4个(共有4个图点),但Cb,Cr各自只记录一个(平均值),这样一来,原本在RGB模式,需要4x3=12 bytes的资料,现在只需要4+1+1=6 bytes,无形中节省了50%的空间,但影响影像品质并没有太多.
致于DCT,其实是有点类似傅立叶转换,将原本属于振幅强度的资料阵列,转换成强度变化频率的资料阵列.
JPEG使用线性数位化,也就是每一个DCT转换值,都被一个不同的数位化系数去除,再四拾五入到一个整数,以储存起来.在这个过程中,变化率阵列的每一个元素,将会视其频率大小,除以一个不同的系数.
对人眼来说,比较缓慢的变化,会比快速变化更被注意.这个过程会把资料的长度大幅降低.所以变化率越大的元素,压缩比越大.这也就是JPEG对于不规则影像( 如电视画面,照片等)比较有利的地方.
影像媒体
影像原理
影像格式
数位图像导论
图片JPEG影像类型讨论
图形压缩,解压缩探讨JPEG 原理
图形压缩,解压缩探讨JPEG 原理
JPEG是一种对彩色或灰阶之类连续色调图形作压缩和解压缩的标准.
这个标准是由ISO/IEC JTC1/SC29 WG10所订定.JPEG可应用在许多如研讨画图片,彩色电传,影像资料库,桌上出版系统,多媒体及医疗等的静态影像的压缩之上.
JPEG最基本的概念就是将影像的一个区块从空间域转换为频率域.一般而言影像高频部份的量会比低频部份要小得多.
而由于人们的眼睛对空间高频的部份较不敏感,因此高频部份就可以用较大量化处理的方式来产生较为粗略的影像来表示,由于较粗略的影像需要较少的位元,于是可以大幅度地减少要储存或通讯的资讯量,而缩减后的资讯影像也的确可以为人们的视觉感官所接受.
影像压缩原理
资料的压缩方法可分为无损压缩 (lossless compression) 与略损压缩(lossy compression)两类.
对于资料本身在压缩后再还原必须保持原貌的需求上,必须使用无损压缩,无损压缩有不得失真的限制,因此压缩效果有限.对于文数字,程式等资料型态适用.
影像资料的一个特性是空间冗余(Spatial Rendancy).
一般来说,在同一张画面上必有一些共通特性(Correlation),也许是色彩上的,也许是几何上的,或是其它特征值得到的.
所谓的空间冗余去除,就是要识别出画面中重要的元素,并移除重复且较无影响的元素的动作.
影像压缩方法概说 (1/2)
首先介绍一种基本的压缩方法: 称为变动长度编码法(Run Length Encoding,简称RLE).
其原理是把资料中重复多次的内容,记录其内容细节与出现约次数.例如: ABCDEABCDEABCDEABODE,我们可记录ABCDE出现4次,两项资讯,是不是比直接记录重复的ABCDE要精简呢
变动长度编码法的算法相当简单,除了可以直接应用外也可以与其他压缩方法搭配.
但变动长度编码法不一定能达到压缩的效果,有时候遇到重复性很低的资料,压过的大小可能不减反增.
影像压缩方法概说 (2/2)
In order to understand the correlation between pixels in an image and hence decide which data to eliminate mathematical transforms are used.
目前使用在影像压缩的最普及数学转换为离散余弦转换 (DCT,Discrete Cosine Transform) .
DCT是用来分析影像资料中较不重要的部分,然后用量化(Quantization)方法将其去除,仅保留重要资讯,来达到高压缩的效果,
而其失真比例可以利用量化参数来加以控制.此方法用于JPEG格式之影像,当压缩比在5% ~ 15%间时,依然能保证其适当的影像品质.此一压缩方法的发展,让影像媒体的储存与应用更加地方便.
JPEG Compression with Different Quality
Original
QF=20
QF=50
QF=30
QF=80
QF=10
原图与压缩图比较
原图与压缩图比较 cont'd
原图与压缩图比较 cont'd
原图与压缩图比较 cont'd
原图与压缩图比较 cont'd
原图与压缩图比较 cont'd
Subjective View of Titanic
Baseline JPEG Encoding
Convert to
8x8 block
Subtract
128 in pixel
DCT
Transform
Quantize
Zigzag/
RLC
Entropy
Encode
DPCM
Encode
DC coefficient
AC Range: -1023 ~ 1023
DC Range: 0 ~ 2048
JPEG 编码及解码器
8X8
像素
区块
FDCT
编码资料流
JPEG
语法
产生器
无失真压缩
霍夫曼编码
失真压缩
量化处理
斜向
扫描
量化表
霍夫曼
编码表
FDCT:Forward Discrete Transform(正离散余弦转换)
8X8
像素
区块
IDCT
编码资料流
JPEG
语法
产生器
无失真压缩
霍夫曼编码
反量化
斜向
扫描
量化表
霍夫曼
编码表
IDCT:Inverse Discrete Transform(逆离散余弦转换)
JPEG编码方式
为了因应不同的通讯及储存状况下之应用,JPEG提供二四种不同的编码方式:
1,循序模式 (Sequential mode)
2,渐进模式(Progressive mode)
3,层模式(Hierarchical mode)
4,无失真模式(Losslessmode)
1,循序模式(Sequential mode)
循序模式编码的方式将影像以扫瞄方式由左至右由上而下作编码,这个循序模式的编码架构简单而有效率,对大部份的应用程式是相当合宜的,架构仅对资料作单一次处理的方式作影像编码的工作,也就是所谓的循序编码的模式了.这种方式对每个输入资料提供8位元的分辨率.
Sequential Coding Example
Sequential Coding Example
2,渐进模式(Progressive mode)
影像的建立无论是采取从模糊的低频影像到清晰的高频影像 (即频谱选择 方式),或是自最大有效位元到最小有效位元的建立方式(即连续近似法), 渐进模式的编码都对影像作多重扫描来作处理.以频谱选择方式为例,影 像以DCT转换到频率域,而一些频宽可立即从DCT系数得到,由于只执行一次DCT,因此在这样的方式下只有一种的空间分辨率.渐进模式对于在频宽受到限制的频道上作影像传输相当有用,使用者可以先看到粗略的影像,再决定是否需要最终的影像.
渐进模式解压缩后影像呈现的方式,先出现模糊的低频影像,而后再显现清晰的高频影像.这种的编码方式满足了许多应用程式渐进呈现显示,算术编码以及对分辨率 (如12位元)的较高需求,算术编码法提供了比Huffman编码法有5-10%更好的压缩.
另外此模式也对循序编码和八位元的分辨率提供了支援.
Progressive Coding Example
Progressive Coding Example
3,阶层模式(Hierarchical mode)
阶层模式的编码方式乃是将影像以低空间分辨率的影像先作编码,再以此低分辨率影像为基础对较高分辨率影像与低分辨率影像问的差异作编码以得到较高分辨率的编码影像.
相同一个影像可以以阶层模式作好几种不同分辨率的编码,阶层模式可以同时满足各种具有不同容量的设备上,使得即使低价的设备也可以将此一多分辨率的影像作解码后得到其所能达到的最佳品质.
相较之下.渐进模式只能采用单一分辨率作影像的重建与显现,阶层模式的确为各种不同的设备提供了更佳的强性与分辨率.
Hierarchical Coding Example
4,无失真模式 (Lossless Mode)
所谓的无失真表示了此模式可以将影像原原本本地将影像还原重建回来.
为了重建时能得到和原来完全一样的影像,在无失真模式下并没有使用DCT,也因此无失真模式的压缩率比使用DCT作压缩处理的失真方式要低得多.
这种模式一般只用在一些如重要的医疗影像等对影像有无失真需求的场合之中,而各个像素的数值从二位元到十六位元都可以.
另外这种的处理模式对循序编码也提供支援,使用者可选择Huffman编码或算术编码的方式作处理.
Lossless Coding
Predictor
Entropy Encoder
Huffman
Table
Source Image
Compressed Data
Lossless encoder
亮度与色度 (1/2)
虽然JPEG并未对色彩空间作规划,但大部份的JPEG应用程式都不用RGB的表示方式.而以YCbCr来表示;另外,也由于人的视力系统对色度的敏锐度比较不高 .
因此以 YCbCr 色度的方式来表示可以再做一次作取样(Subsampling) 来减低资讯量,这也是普遍使用YCbCr.另一个重要的理由.如下图所示的.
4:4:4格式代表 YCbCr 原来完整的资讯.而色度表示法可以再次取样以4:2:2或4:2:0格式来表达;4:2:2格式将原本的资讯旦减少为三分之二.
而4:2:0格式则可以将资讯三减少为一半.虽然色度的资讯量减少了.但对人的视觉神经而言却仅仅感受到微小的差别而已.
亮度与色度 (2/2)
离散余弦转换
为了说明执行离散余弦转换 (DCT: Discrete Cosine Transform)的影响,我们将以自一张图取下的一个小区块 (8X8像素)的亮度资料,并将之转换成空间频率域,而后再自每个像素值中减去128以期每个像素都可以符合在DCT算法中的8位元运算范围.经过转换后的二维 (2D)系数如下所示,这个2D频率域的横轴以fx表示而纵轴以fy来表示;左上角代表DC的系数值 -80,低频部份包含了区块的大部份能量.而对人眼较不敏感的高频部份,则通常含有较低的能量.
0
0
0
-2
-4
0
8
0
-2
-2
0
0
0
6
0
12
0
0
-2
0
-4
6
8
-2
0
-2
4
10
-6
-2
0
8
-2
4
4
-4
-12
0
-4
10
2
0
0
0
12
8
-8
24
0
-2
-2
2
6
-6
4
-80
量化 (1/2)
以下所列为 JPEG所建议的量化(Quantization)矩阵,以期能对每秒 30个 720X576像素画面的 CCIR-601 标准作影像的处理与显示.
这个矩阵的目的是在对亮度(Luminance)是作量化处理,至于色度(Chrominance)系数则还有另一个矩阵做处理.
99
103
100
112
98
95
92
72
101
120
121
103
87
78
64
49
92
113
104
81
64
55
35
24
77
103
109
68
56
37
22
18
62
80
87
51
29
22
17
14
56
69
57
40
24
16
13
14
55
60
58
26
19
14
12
12
61
51
40
24
16
10
11
16
量化 (2/2)
在亮度系数的量化方面,每个 2D DCT 系数除以相对的量化矩阵的值,在四舍五入后得到如下的量化后 DCT 系数:
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
-1
0
0
1
0
0
0
0
1
1
-1
2
0
0
0
0
0
0
0
-5
举例来说,DC系数 -80除以其所相对应值16后得到量化值 -5.注意量化后区块高频部份出现许多零值,代表人类视觉系统对高频部份并不敏感.由于四舍五入的部份并不能在解码时重现,因此这个步骤将是个失真的过程.
斜向扫描 (Zigzag Scanning) (1/2)
区块在量化之后,只有低频的部份有非零值,为了能进一步地减少储存空间与通讯容量的大小.
尽可能地将零值放在一起,使得处理时能以几个零来表示而非个别的处理每个零.
因此运用如下图的方式做斜向扫描 (zigzag scan),这种斜向扫描的扫描线乃是沿着空间频率大小增加的方向作扫描的.
使得许多的零可以被串接在一起,达到原来的期望.
斜向扫描(2/2)
对量化后系数作斜向扫描的情形,斜向扫描仅针对AC系数部份作处理.
也就是跳过左上角DC系数的部份,至于DC系数的部分则另行以下图的方式与其所相邻的区块作扫描.
字流长度与霍夫曼编码法
扫描完成后,接下来的工作便运用字流长度 (Run length)与霍夫曼(Huffman)编码法混用的方式,以期使得位元的数量能够达到最佳化的目的.首先自斜向扫描处理取得序列的AC系数,如上例得到以下数列:0,2,1,-1,0,0,1,0,1,1,0,0,1,0,0,0,-1,0,0,-1,..,0,而后字流长度或称为变动长度(Variable length)编码对这个序列作编码以更进一步地降低所需的位元数,编码的数值所得到的是由零值的数目按着非零值的数所构成,而得到如下的编码序列格式:
(字流中零值的数目,下个非零值的数)
因此,如上面的例子就可以编码成:(1,2) ,(0,1) , (0,-1) , (2,1) , (1,1) , (0,1),(0,1),(2,1),(3,-1),End of Block (EOB) 来表示;而后再以霍夫曼编码减少为了要代表字流长度编码的位元数.
霍夫曼编码是依统计所推论出来让最常用的码以最少的位元数来表示,JPEG为亮度与色度的DC及AC的霍夫曼编码提供了一个表格以为处理之需;另外在作阶层模式或无失真模式编码时,也可借以算术编码表的运用来取代霍夫曼编码表.
⑥ 图像的特征提取都有哪些算法
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
一 颜色特征
(一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。
(二)常用的特征提取与匹配方法
(1) 颜色直方图
其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。
最常用的颜色空间:RGB颜色空间、HSV颜色空间。
颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。
(2) 颜色集
颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从 RGB颜色空间转化成视觉均衡的颜色空间(如 HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系
(3) 颜色矩
这种方法的数学基础在于:图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。
(4) 颜色聚合向量
其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。
(5) 颜色相关图
二 纹理特征
(一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。
例如,水中的倒影,光滑的金属面互相反射造成的影响等都会导致纹理的变化。由于这些不是物体本身的特性,因而将纹理信息应用于检索时,有时这些虚假的纹理会对检索造成“误导”。
在检索具有粗细、疏密等方面较大差别的纹理图像时,利用纹理特征是一种有效的方法。但当纹理之间的粗细、疏密等易于分辨的信息之间相差不大的时候,通常的纹理特征很难准确地反映出人的视觉感觉不同的纹理之间的差别。
(二)常用的特征提取与匹配方法
纹理特征描述方法分类
(1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数
(2)几何法
所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和结构法。
(3)模型法
模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法
(4)信号处理法
纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。
灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneous auto-regressive, SAR)是马尔可夫随机场(MRF)模型的一种应用实例。
三 形状特征
(一)特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题,包括:①目前基于形状的检索方法还缺乏比较完善的数学模型;②如果目标有变形时检索结果往往不太可靠;③许多形状特征仅描述了目标局部的性质,要全面描述目标常对计算时间和存储量有较高的要求;④许多形状特征所反映的目标形状信息与人的直观感觉不完全一致,或者说,特征空间的相似性与人视觉系统感受到的相似性有差别。另外,从 2-D 图像中表现的 3-D 物体实际上只是物体在空间某一平面的投影,从 2-D 图像中反映出来的形状常不是 3-D 物体真实的形状,由于视点的变化,可能会产生各种失真。
(二)常用的特征提取与匹配方法
Ⅰ几种典型的形状特征描述方法
通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。
几种典型的形状特征描述方法:
(1)边界特征法该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点—线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。
(2)傅里叶形状描述符法
傅里叶形状描述符(Fourier shape descriptors)基本思想是用物体边界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。
由边界点导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。
(3)几何参数法
形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shape factor)。在 QBIC 系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。
需要说明的是,形状参数的提取,必须以图像处理及图像分割为前提,参数的准确性必然受到分割效果的影响,对分割效果很差的图像,形状参数甚至无法提取。
(4)形状不变矩法
利用目标所占区域的矩作为形状描述参数。
(5)其它方法
近年来,在形状的表示和匹配方面的工作还包括有限元法(Finite Element Method 或 FEM)、旋转函数(Turning Function)和小波描述符(Wavelet Descriptor)等方法。
Ⅱ 基于小波和相对矩的形状特征提取与匹配
该方法先用小波变换模极大值得到多尺度边缘图像,然后计算每一尺度的 7个不变矩,再转化为 10 个相对矩,将所有尺度上的相对矩作为图像特征向量,从而统一了区域和封闭、不封闭结构。
四 空间关系特征
(一)特点:所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息。前一种关系强调的是目标之间的相对情况,如上下左右关系等,后一种关系强调的是目标之间的距离大小以及方位。显而易见,由绝对空间位置可推出相对空间位置,但表达相对空间位置信息常比较简单。
空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其它特征来配合。
(二)常用的特征提取与匹配方法
提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。
⑦ 图像处理与分类方法
(一)图像处理方法
全景钻孔摄像系统实现视频图像数字化的基础是用C++语言编制而成的采集软件和分析软件。采集软件使探测到的钻孔视频图像数字化,再通过分析软件对其中的信息图像进行识别,完成对数字图像和重要信息的存储和维护。
采集软件(图9-17)的主要功能如下:
1)捕获图像。通过新建gra格式的文件捕获视频数据,并形成数字图像。在进行图像捕获之前需设定视频数据的工作环境(钻孔孔径、探头直径等),以满足数据转换的要求。
2)实时显示。在进行图像捕获的同时将处理后的直观图像快速地显示出来,便于实时监控数据处理过程。
3)图像存储。将捕获后的数字图像以gra文件的格式存储于计算机硬盘中。
4)图像识别。对某帧或某些帧图像中的有用信息进行计算分析,从中获得具体数据,主要包括:识别罗盘图像并计算罗盘方位,识别深度数据。
5)深度修正。对视频图像中的深度数据与真实的深度进行修正。
图9-17 数据采集软件(BHImgCapt)
数据分析软件(图9-18)的主要功能如下:
1)形成三维图像。三维图像就是三维钻孔岩心图,它是通过钻孔孔壁图模拟出来的,也称为“虚拟”钻孔岩心图,形成的三维图像便于更直观地观测孔壁。
2)计算分析。计算分析的功能包括计算结构面产状和隙宽、建立结构面数据库、备注结构面的几何形态等,为进一步对结构面进行统计分析创造条件。
3)打印输出。统计分析形成的任何图像都可以彩色打印输出。
图9-18 数据分析软件(BHImgCapt)
(二)统计分类方法
为了更直观地展现经数据采集与分析软件获得的孔内结构面数据(结构面产状、深度、张开度及裂隙填充情况等)分布特征,首先借助 Microsoft Excel的数据统计功能将结构面数据按倾角和张开度大小进行分类汇总(表9-4和表9-5),然后用统计分析软件Origin和DIPS绘制裂隙的倾向玫瑰花图和产状极点密度图(图9-19和图9-20)。
表9-4 按倾角大小的分类汇总
表9-5 按隙宽大小的分类汇总
图9-19 Origin软件界面及倾向玫瑰花图
图9-20 Dips软件界面及产状极点密度图
⑧ jpeg图像隐写分析有几种方法
[jsteg.zip] - jsteg隐写算法[23][24]由D. Upham提出,该算法将秘密信息嵌入在量化后的DCT系数的LSB上,但值为-1、0、+1的DCT系数例外。提取秘密信息时,也只是将隐藏信息的图像中不等于-1、0、+1的量化DCT系数的LSB取出即可 [attackjsteg.rar] - 抗jsteg的隐写分析,jsteg jpeg图像隐写的重要方法之一。 [kafang.zip] - 对图像以嵌入率为rate进行顺序LSB嵌入,然后进行卡方隐写分析 [LSB-information-hiding.rar] - 设计并实现一种基于图像的LSB卡方因袭分析方法 [JPEGjsteg.rar] - jsteg_Mu可批量对JPEG图像进行Jsteg隐写。 Jpeg_Or 为jpeg密写的原始图像的文件夹, Jpeg_Di 为jpeg密写后密写了的图像的文件夹,code_file 为密写的文件,rate 为密写嵌入率. [RS.rar] - 信息隐藏里LSB隐写方案的RS分析方法,附有详细注解。
⑨ 软件工程专业中对图像分析包括哪些内容
摘要 黑白图像是指像素只能是黑,灰度像是指每个像素的信息由一个量化的灰度来描述的,像没有彩色信息。