电子说
36 、数字图像类型
黑白图像:图像的每个像素只能是黑或白,没有中间的过渡,故又称为二值图像。二值图像的像素值只有0.1。
灰度图像:灰度图像是每个像素的信息由一个量化的灰度级来描述图像,没有彩色信息。
彩色图像:彩色图像是指每个像素的信息由RGB三原色构成的图像,其中RBG是由不同的灰度级来描述的。
序列图像:把具有一定联系的、具有时间先后关系的图像称为序列图像。我们经常看到的电视剧或电影图像主要是由序列图像构成的。序列图像是数字多媒体的重要组成部分。序列图像是单幅数字图像在时间轴上的扩展,可以将视频的每一帧视为一幅静止的图像。
37 、采样/量化/色彩/直方图
采样
对连续的2D信号(图像)进行采样,将依据预先定义的行数和列数得到一个完整的二维信号数组。给定行和列相交处的点(元素)称为像素。采样原始图像是一个有损操作-采样图像的质量取决于预设的采样水平。
用不同采样等级得到的图像
量化
量化等级表示的是在数字图像中,每个像素的取值范围.常用的量化等级有2,64,256,1024,4096,16384等等。举例来说,如果我们使用1024个量化等级,那么在图像中每个像素可能的取值就是0~1023中的某个数。
使用不同量化等级得到的图像
色彩
对数字图像来说,最后一个要素是每个像素的色彩。当前最流行的色彩模型是RGB模型,我们用红绿蓝3个颜色分量来表示任意一种颜色。在RGB模式图像中,每个像素点包含了其在3个颜色分量下的饱和度。
另一个常用的色彩模型是HSV,HSV模型同样使用3个分量来表示色彩:色调,饱和度,明度.这个模型可以在颜色空间中表示为一个圆锥形。
在印刷行业,最受欢迎的颜色模式是CMYK,它包含4种基本颜色:青,品红,黄,黑,它们互相调和形成最终的颜色.
直方图
图像直方图是图像中每种颜色或亮度等级发生次数的统计信息。直方图告诉我们很多关于图像的信息----不仅限于亮度和对比度。使用直方图,我们可以判断图像细节是否已被正确捕获和存储。在分析彩色图像时,我们接收每个颜色的直方图(RGB)。灰度图像则使用单一的直方图。
彩色和灰度图像的直方图
38 、数据量与信息量
数据量,就是一张图像占了多少个字节,比如1万个像素,每个像素占1个字节,那未压缩前的数据量就是 1万个字节。
信息量,信息量表示一张图片里包含了多少种信息。假如一张全白的图片,它只有"白色"这个信息,那么它的信息量就很小,白色像素出现的概率是1,非常大。这样的图片不管它数据量再大,假设是1万乘1万的大小,都可以压缩到很小的程度。假如一张五颜六色的图片,里面包含很多不同的颜色信息,说明它信息量很大,那么就很难被压缩了。
39 、图像处理和计算机视觉的分类
关于图像处理,图像分析和计算机视觉的划分并没有一个很统一的标准。按照当前流行的分类方法,分为三部分:
A.图像处理:对输入的图像做某种变换,输出仍然是图像,基本不涉及或者很少涉及图像内容的分析。比较典型的有图像变换,图像增强,图像去噪,图像压缩,图像恢复,二值图像处理等等。基于阈值的图像分割也属于图像处理的范畴。一般处理的是单幅图像。
B.图像分析:对图像的内容进行分析,提取有意义的特征,以便于后续的处理。处理的仍然是单幅图像。
C.计算机视觉:对图像分析得到的特征进行分析,提取场景的语义表示,让计算机具有人眼和人脑的能力。这时处理的是多幅图像或者序列图像,当然也包括部分单幅图像。
40 、选取相机
相机还应该提供:相机功能和成像质量。一台好相机决不只是像素数高。您还应该考虑到成像质量和相机功能。在评估数字相机的成像质量时,重要因素除分辨率外,还包括感光度、动态范围及 信噪比。就相机功能来说,最重要的功能之一是速度,通常以每秒帧数(fps)来表示。它定义每秒能够记录的最大帧数
41 、图像内插
图像内插:已知数据来估计未知位置的数值的处理。在放大、缩放、旋转和几何校正中广泛使用,是基本的重取样方法。
最近邻内插法:假设一幅图像大小为500x500像素,将其放大1.5倍到750x750像素。创建一个假想的750x750的网格,它与原始图像有相同的间隔,然后将收缩,使它准确地与原图匹配。此时750x750的网格的像素要小于原图像的像素间隔,在原图像中寻找最接近的像素,并把该像素的灰度赋给750x750网格中的新对象。然后将图像扩展到原来规定的大小,得到放大后的图像。这种方法简单,但可能产生不希望的结果,如直边缘的严重失真。
双线性内插:用4个最近邻去估计给定位置的灰度。令(x, y)为想要赋以灰度值的位置的坐标,并令v(x, y)表示灰度值,对于双线性内插来说,赋值公式为:
v(x,y)=ax+by+cxy+d
4个系数由4个用(x, y)点最近邻点写出的未知方程确定。
双三次内插:用16个最近邻点去估计给定位置的灰度。公式如下:
v(x,y)=∑i=03∑j=03aijxiyj
当上限为1时,该方程与双线性内插方法是一致的。双三次内插是商业图像编辑程序的标准内插方法。
相邻像素:位于坐标(x, y)处的像素p有4个水平和垂直的相邻像素,其坐标由为:
(x+1,y),(x−1,y),(x,y+1),(x,y−1)
这组像素称为p的4领域(4-neighbors of p),用N4(p)表示。
p的4个对角(diagonal)相邻像素坐标为:
(x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1)
用ND(p)表示。这些点与4个邻点一起称为p的8邻域(8-neighbors of p)。用N8(p)表示。如果(x, y)位于图像的边界上,某些邻点会落入图像的外边。
全部0条评论
快来发表一下你的评论吧 !