您好, 访客   登录/注册

基于RGB颜色信息聚类的光谱反射率重建

来源:用户上传      作者:程青彪 陈广云 王大文 李欣庭 冯洁

  关键词:聚类分析;光谱反射率重建;BP 神经网络;颜色
  引言
  随着数字技术的不断发展,我国对于颜色精确复制的研究也在不断向前推进。目前使用较多的颜色复制的方法是通过多光谱成像系统以及分光光度计,测出训练样本在各个波段的响应值以及不受其他条件干扰的光谱反射率,从而进行光谱反射率重建该方法能够较好的完成颜色重建工作。所使用的方法主要包括伪逆法[1]、多项式扩展法[2]、主成分分析法(PCA 法)[3-4]、BP 神经网络[5] 等,其中,BP 神经网络是一种重建精度较高的方法。它将相机响应值与经过奇异值分解的训练样本的主成分系数进行建模,然后使用建立好的模型以及测试样本的响应值得出测试样本的主成分系数,将其与基向量结合完成光谱反射率的重建[5]。
  使用BP 神经网络重建光谱反射率不可避免的需要用到训练样本与测试样本,因此样本的选择对于重建精度也会产生较大的影响[6]。针对这一问题,研究人员也提出了许多样本选取方法,主要包括Hardeberg 提出的最小条件数选取方法[7]、Shen 等提出的特征向量优化的颜色样本选取方法[8]、Mohammadi 等提出的光谱空间距离聚类的样本选取方法[9],以及龙艳群等提出的聚类方法[6] 等。在选择样本时,使用聚类算法可以对样本进行更精确的分类。龙艳群等[6] 在实验中采用的聚类方法主要是基于色度空间对于所有样本进行聚类分析,即在CIEL*a*b*色度空间对样本从a*、b*两个维度进行聚类,然而,这种方法没有包含样本亮度信息。本文通过将信息相近的样本分为一类以提高重建精度,为了使实验能够在一定程度上减少工作量的同时保证聚类效果,提出针对相机响应值直接进行模糊聚类的光谱反射率重建算法。这种模糊聚类方法能够对样本颜色信息和亮度信息同时聚类,更多的利用了样本自身的信息,能够通过相近颜色的样本进行训练与重建,从而提高重建精度。在实验中,首先根据均方根误差初步确定出最优聚类数目[10],之后使用BP 神经网络、主成分分析法进行光谱反射率重建并对结果进行对比评价。实验结果表明,本文所提出的方法对于光谱反射率重建精度有较高的提升。
  1 光谱反射率重建算法
  1.1 主成分分析法(PCA 法)
  光谱反射率重建一般是利用多光谱成像系统设备响应值来重建颜色的光谱反射率,其实质是建立样本的相机响应值与光谱反射率之间转换矩阵,利用转换矩阵实现光谱重建。而在实际实验的过程中,通过分光光度计获取的光谱反射率数据特征较多,存在部分噪声,对实验效果会产生一定的影响。使用PCA 法能够对高维数据进行降维处理,从而降低噪声的影响[11]。它将多维的光谱数据分解为一系列的特征向量的线性叠加,后通过分解出的主成分系数进行光谱反射率重建。
  将光谱反射率数据集R 表示为n 个相互正交的特征向量bi 的线性组合[12],则:
  原光谱反射率数据可以通过选取前k 个主成分进行线性组合来表示。前k 个主成分的重要程度可以通过主成分贡献率 来表示,即:
  1.2 BP 神经网络
  BP 神经网络由输入层、隐含层、输出层三部分构成,其学习过程包括向前传递和向后传播两部分。在进行正向传播时,样本数据从输入层传入,经过隐含层逐层处理后,最终传向输出层[5,13],即:
  如果输出层的实际输出与期望输出不符,那么将进入误差的反向传播阶段。误差的反向传播将输出误差通过隐含层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号:
  误差信号将作为修正各单元权重的依据对网络中每一个神经元进行权重调整,进而使输出值接近期望目标。
  在本文实验中,采取双层向前型神经网络结构,成像系统相机的响应值作为神经网络系统的输入值,输出值则为主成分系数。该神经网络的第一层有10 个神经元,输出函数为Tansing 函数;第二层有8 个神经元,输出为Purelin 线性函数。输入信号为相机响应信号向量,使用数据集中前8 个特征向量来代表整体,与其相对应的系数作为主成分系数。神经网络中的权值和阈值可通过训练样本拟合数据而得到,通过训练好的神经网络,得到测试样本主成分系数,再将它与基向量计算从而得出重建的光谱反射率[5]。
  2 颜色模糊CC均值聚类算法(FCM)
  在进行光谱反射率重建的研究中由于光谱数据维度高且较冗杂的现象,会使重建工作耗费更多的时间且重建精度较低,因此研究者们采用不同的样本选择进行光谱反射率重建来提高重建精度。本文在此基础上,根据颜色RGB 信息的空间距离来对色卡数据进行模糊CC均值聚类,并对聚类后每一类的样本进行光谱反射率重建来验证其可行性。
  模糊CC均值聚类是众多模糊聚类算法中使用最广泛且比较成功的一种,它通过优化目标函数得到每个样本点对所有类中心的`属度,然后决定每个样本点的类属以达到自动对样本数据进行分类的目的。
  式中: 为第j 个样本对于第i 类的隶属度;为第i 个聚类中心;m 为大于等于1 的常数;为第j 个样本。目标函数实质是各样本点到各类的欧式距离的和(误差的平方和)。聚类的过程就是最小化目标函数的过程,经过反复的迭代逐步降低目标函数的误差值,当目标函数收敛时,就能够得到最终的聚类结果[13]。
  3 实验与结果分析
  本文实验以Munsell 色卡作为研究样本,采用CIE 推荐的45/0(45°/垂直)照明和观测条件,利用佳能相机在D65 标准光源下,拍摄Munsell色卡的RGB 图像以获取相应的相机响应值。同时,使用分光光度计X-Rite SP64 在D65 光源2°视场下,以10 nm 为间隔采集400~700 nm 波长的Munsell 色卡的光谱反射率数据。Munsell色卡共包含1 602 个色块,为了确保实验的有效性,实验取出第10i (i=1,2,3 )个色块作为测试样本,其余色块作为训练样本,因此实验共有1 442 个训练样本,160 个测试样本。通过对测试样本RGB 信息聚类从而将样本分为颜色相近的每一类,后使用BP 网络进行每一类样本的光谱反射率重建。

nlc202208261015



转载注明来源:https://www.xzbu.com/1/view-15438473.htm

相关文章