电子说
篡改(污损) 文件鉴定是文书鉴定中常规的鉴定项目, 是对检材是否存在变造事实及变造内 容进行检验和鉴别, 或对受污损的检材进行整理、恢复固定、显示和辨认模糊或不可见内容 的专门技术。篡改(污损)文件鉴定中常用的鉴定方法有宏观 检验法、显微检验法、压痕检验法和理化检验检测法等。在检案实践中,通常采用无损的宏 观检验法、显微检验法和压痕检验法,从形态学的角度对 文件要素的墨迹分布、色泽、压 痕等特征进行检验。当运用上述检验方法无法达到鉴定目的时,则需要 采用理化检验检测 法对文件要素进一步检验分析。针对上述文件要素理化特性检验方法的不足,寻找一种能够达到无损检验、 可整体成像,且可操作性强、区分程度高的检测分析方法十分必要。高光谱成像(HSI)是 一种采用原位分析技术识别物质信息的方法, 具有快速、无损的特点。该技术是一种光谱传 感技术,在可见光到近红外的光谱范围内,通过核心元件分光器 进行连续窄波分光,每个 波段进行高分辨率的二维面阵成像,获得完整的高光谱高清图像序列, 具有光谱范围大、波 段间隔小、波段信息丰富等特点,极大增强了成像的光谱分辨率和空间分辨率,可有效 弥 补现有鉴定方法的不足。该方法最初应用于遥感 领域的卫星和空间站, 目前已被应用于农业和水资源控制、军事防御、文物保护、考古、医学诊断、犯罪现场分析与重建、法庭科 学与食品质量检测等领域。
1 高光谱成像技术概述
HSI 技术是成像技术与光谱技术的结合,既可以通过成像技术获取待测样品表面高分辨率图 像,也可以通过光谱技术检测待测样品成分信息。
1.1 基本原理
HSI 技术是在多光谱成像的基础上, 利用光谱范围更宽、分辨率更高的高光谱相机,采集样 品表面的图像信息和光谱信息, 形成数字存储的图像立方体, 同时将每个图像中每个像素的 强度绘制成对应波长的函数, 从而在给定波长下产生待测样品的反射光谱曲线。高光谱图像 类似于一叠图像的集合, 每个图像都是在一个狭窄的光谱带上获得的, 并由此生一个三维数 据集, 即图像立方体,其由两个空间维度(X,Y) 和一个波长维度 (λ)组成。图像立方 体沿光谱维度的每个切片被称 为一个波段或通道, 并为每个波长维度(λ) 提供了 平面的 图像, 可以从每个单独的像素(Xj,Yk)中获 得光谱信息。正是基于“图像立方体”的搭建, HSI 技术达到了“图谱合一”。高光谱图像是由一系列 不同波段上的图像立方体组成, 波段范 围涵盖紫外 (200 ~ 400 nm) 、可见光(400 ~ 760nm) 、近红外(760 ~ 2560 nm), 波段范围广且波段窄(≤10-2λ ), 可获取丰富的空间维度上的光谱信息和不同波长维度上 的 图像信息。
1.2 高光谱图像特点
高光谱图像区别于其他光谱成像的显著特点在于其空间分辨率和光谱分辨率更高。空间分辨 率可用于衡量图像像素之间的几何关系,而光谱分辨率决定了图像像素内部的变化与波长的 关系。
1.2.1 空间分辨率
空间分辨率可被定义为图像中最小的可识别细节,是图像中能够区分的最小单元的尺寸或大 小, 空间分辨率的高低通常表明图像细节的可分辨程度,常用像元大小、像解率或视场角来 表示。在高光谱图像中,图像的清晰度取决于其空间分辨率的大小,而非图像中像素数量的 多少。图像的空间特性取决于成像传感器自身的设计。
1.2.2 光谱分辨率
光谱分辨率可被定义为传感器测量的光谱带数量和光谱范围, 其核心元件是成像传感器。光 谱范围较宽时,若成像传感器捕获的光谱带数量较少, 其光谱分辨率仍然很低; 光谱范围较 窄时,若成像传感器捕获的光谱带数量较多, 则其光谱分辨率较高,因为其能够区分具有相 近或相似光谱特征的成分。光谱分辨率的高低取决于成像传感器所捕 获的光谱带的数量, 与光谱范围的宽窄无关。相较于多光谱图像, 高光谱的成像传感器可在较广的波段范围内获 取大量连续且极窄的光谱信息, 能解析待测样品中存在的更精细的光谱特征。
1.3 实现路径
典型的高光谱成像系统包含物镜、波长调制器、检测器、照明和采集系统等部件, 所有这些 部件可以根据检测需求进行调整。在文件鉴定中,高光谱成像技术为近景拍摄, 针对所检测 样品的特点,相较于传统的成像技术,可以选择不同的物镜来获得合适的空间分辨率。首先 获取到高光谱图像, 通过数据预 处理、数据分析流程后, 再将处理后的数据应用到篡改(污
损)文件鉴定实践中,其实现路径详见图 1。
图 1 篡 改 (污 损 ) 文 件 鉴 定 中 高 光 谱 数 据 处 理 路 径
2 高光谱图像数据分析算法
高光谱图像是由连续波段的光谱信息组成,波段较多且相邻波段之间有着很强的相关性,这 使得获取的数据在一定程度上存在冗余现象,而且较大的数据量为图像的处理工作带来了挑 战。在海量数据分析运算中, 如何对数据进行筛选和分类显得 尤为重要。本文结合篡改(污 损)文件鉴定领域实际需求,着重介绍高光谱图像数据降维算法和数据分类算法。
2.1 高光谱图像数据降维算法
数据降维处理的基本思路是在不改变高维数据结构的前提下,将高维空间的数据投影到二维 等低维空间中进行分析。目前, 高光谱图像数据降维较为常用的算法分为波段选择和特征提 取两大类。 波段选择是从原始波段中选择最有效波段来 降低数据集维度,对某一模式的测 量值进行变换, 以突出该模式下的代表性特征。该方法可以直观观察获取影像的光谱曲线并 从中选择出文件要素中不同物质的敏感波段, 从而较好地保留图像中物质的光谱特征。实践 中,ZOHAIB 等提出一种新颖的联合稀疏主成分分析算法,用于检测手写笔迹中墨水高光谱 图像数据的降维和特征选择。特征提取基于各光谱波段间的重新组合和优化,通过对原始数 据按照一定的操作函数进行变换,以实现信息综合 、特征增强和光谱减维的过程。常用的 特征提取算法详见表 1。实践中,数据降维处理中通常采用多种算法联用,以达到最佳选取
效果。
表1高光谱图像数据特征提取常用算法及特性
2.2 高光谱图像数据分类算法
高光谱图像分类旨在通过提取不同类别样品 最大差异性的光谱特征,最大程度地挖掘图像 特征, 同时通过发现复杂数据的内涵来提高高光谱图像的分类精度,是区分文件要素中不同
物质的关键环节。常用的分类方法详见表 2。
表 2 高光谱图像数据常用分类算法及特性
3 高光谱成像技术在篡改(污损) 文件鉴定中的应用
成像技术是法庭科学领域内的热点技术 ,比如拉曼成像技术、 DESI-质谱成像技术、红外光 谱成像技术等,但图像分辨率仍有待提高。高分辨率的图像有助于抓取更多的细节信息,有 利于鉴定工作者开展工作。现阶段高光谱成像系统在众多领域已有了广泛应用,但在篡改(污 损)文件鉴定中的应用仍处于探索阶段。现有的研究成果基本解决了以下两方面的问题: 一是利用设备的不断更新,结合高光谱成像技术“图谱合一”、数据量丰富的特点, 基于文件 鉴定领域文件要素的特性,在一定程度上提升了模糊图像的清晰化程度,提高了文件要素物质材料识别的准确率。比如使用液晶可调谐滤光片成像设备,成功获取到高空间分辨率、高 光谱分辨率的“双高”光谱图像。
二是通过更新算法抓取有价值数据。在获取多维度、海量数据后,如何迅速识别及抓取有价 值数据,这就涉及到数据降维以及具体的数据分类方法。学者通过研究选用或者改进已有算 法, 可分离数据中的噪声,最大程度地降低环境、纸张背景引起的荧光干扰,减少后处理中 的数据量,使数据发挥最大功效。HSI 技术在篡改(污损) 文件鉴定中的主要应用详见表 3, 所用高光谱成像设备根据其工作原理以及实验需求与各种光源、光学滤光器以及光谱仪等组 合使用的高光谱成像系统。根据需检文件要素种类的不同,HSI技术的应用可具体划分为在 字迹、印文和手印中的应用。 HSI 技术在字迹中的应用, 现阶段主要用于书写墨水数据库的 建立、颜色相似墨水的区分以及字迹是否有添加、改写等情形,常采用主成分分析法、最小 噪声分离变换法进行数据降维, 并有学者对算法进行改进,建立了高效的高光谱文件成像系 统, 更适用于文件检验领域的实际需求。书写墨水数据库的建立,一方面有助于实现书写工 具的种属认定,为字迹是否为书写工具直接书写形成提供依据;另一方面,可从物质成分角 度判断文件上外观相似的字迹是否有涂改痕迹。HSI 技术目前在印文中的应用尚且不多, 但 在模糊印文处理方面却有显著研究成果。在模糊记载鉴定中可借鉴相关实验方法, 对文件上 不易辨认或不可见内容进行显现、辨认和识别。同时, 壁画颜料高光谱数据库的建立, 为常 用印油、印泥高光谱数据库的建立提供了借鉴,印油、印泥高光谱数据库可作为印文种属认 定的参考依据。 HSI 技术在手印中的应用, 着重于研究各种客体表面潜在指印的显现及模糊 指印的清晰化处理。常规显现文件上的潜在指印时,在纸张等渗透性客体上,经常使用茚三 酮和 DFO 溶液等化学试剂进行显现,其原理是基于化学试剂与指印中的氨基酸、皮脂等物 质发生反应,从而使得潜在指印可视化。手指蘸墨捺印形成的指印,在客体表面留下可见墨迹纹线的同时, 也会遗留氨基酸、皮脂等物质;复制形成的指印, 其可见墨迹纹线中多数只有印油或印刷材料的遗留,无氨基酸、皮脂的沉积。故氨基酸、皮脂等遗留于客体表面的物 质是鉴别指印系捺印形成或复制形成的重要指标。基于上述原理, HSI 技术可用于确认文件 上待检指印的形成方式。具体而言, 使用 HSI 技术获取待检指印的光谱信息,进一步分析 光谱中是否存在因氨基酸、皮脂等物质的影响而产生的峰值, 从而为待检指印具体的形成方式提供数据图谱支撑。
表 3 高光谱成像技术在篡改(污损)文件鉴定中的应用
4 总结语展望
本文总结了 HSI 技术在篡改(污损) 文件鉴定领域的应用流程和范围, 该技术可极大地提 升信息获取的深度和广度,且可操作性较强。但是, 其作为引入的一种新技术,在具体适用 方面仍面临一些挑战。首先, 在获取高光谱图像后,目前数据预处理算法对其研究有限,而 其他算法对于文件要素的适用性及处理效果如何, 仍是未来研究中需要持续关注的问题。随 着人工神经网络技术的快速发展,利用机器学习高光谱图像及光谱的内在信息和表示层次, 以达到识别文字、图像等数据的能力,同时通过调整聚类算法来提高工作效率、降低人工操 作易产生的误差,也是未来的发展趋势。其次,运用光谱信息分析文件要素的物质成分,是 解决篡改(污损) 文件鉴定难点的有效途径。比如区分喷墨打印与墨水书写、喷墨打印与印油盖印等, 在很大程度上依赖于墨水的印油和墨粉的高光谱数据库的搭建。由于文件要素材 料的多样性以及研究的局限性, 目前国内还未建立相关的高光谱数据库,因此亟待对其进一 步完善。最后,篡改文件通常使用与原文件要素外观极其相似的其他物质材料进行添改、掩 盖等操作, 如何提升高光谱数据分类的精度以及与其他检验检测方法互相佐证, 也是具体应 用中需要考虑的现实问题。
莱森光学(LiSen Optics)作为世界领先的光谱学解决方案提供商,是一家提供光机电一体化集成解决方案的高科技公司,我们专注于光谱传感和光电应用系统的研发、生产和销售。致力于为客户提供高品质、专业化、精细化的光电技术服务。凭借着在光学行业中丰富的经验,我们能够为每一位客户“量身定做”满足个性化需求的光机电一体化解决方案。
审核编辑 黄昊宇
全部0条评论
快来发表一下你的评论吧 !