稀疏表示(SRC)中字典的构建对分级的效率和准确率至关重要,提出一种基于密度的 SRC字典构建方法, 并利用建立好的 DSRC(基于密度的 SRC)对烟叶进行分级。该方法将减法聚类算法中基于密度选择中心的思想应用 于稀疏算法中进行字典构建,通过确定合适的聚类半径 kia、kib以及约束条件来确定字典原子,不仅可减少字典原子数 目,而且选择的字典具有更好的代表性。基于该方法选择的字典对 2013年(13个等级)、2014年(6个等级)和 2015 年(42个等级)的烟叶进行分级,试验结果表明,该方法不仅可以提高烟叶分级的准确率,而且还可以有效地提高烟叶 分级速度。
现阶段,在我国的烟叶收购过程中,大多是通过人工方式 来对其进行分级。这种带有较大主观性的分级方式在人力、 物力有限的情况下,存在较大的误差,进而影响卷烟质量。近 年来,计算机和人工智能技术越来越多地被应用于农产品检 测中,基于计算机视觉和红外光谱分析技术的烟叶无损分级 引起越来越多的关注[1-2]。
基于计算机视觉的烟叶分级研究主要集中于识别方法和 数字图像特征筛选方法的研究[1-2]。用于烟叶智能分级的方 法有很多,如最近邻、径向基神经网络、支持向量机、Ada boost、粗糙集、随机森林[3]和稀疏表示[4]等,在文献[4]中简 单地随机地选择每级烟叶中的 2/3作为字典原子建立稀疏表 示字典,这样选择的字典不仅原子数目大,影响烟叶分级时 间,而且可能选择了不正确的样本作为字典,因而影响烟叶分 级的准确率。合适的字典对烟叶分级的准确率和速度都有重 要的影响,为此本研究提出一种基于密度的稀疏表示算法对 烟叶进行分级。
减法聚类算法是 Chiu于 1994年在山峰聚类算法的基础 上提出的,此方法根据欧氏距离准则对每个样本点计算其密度值(山峰值),选择其中密度最大的点作为聚类中心[5]。然 后对剩余样本的密度进行更新,重复选择密度值最大的样本 点直到到达设定的条件为止。本研究将减法聚类算法中基于 密度的聚类中心的选择思想应用于稀疏表示的字典原子构建 中,提出一种基于密度的稀疏表示方法[6]。通过确定每类中 合适的聚类半径 kia、kib以及约束条件确定字典原子数目和选 择字典原子,然后通过求解 L1 范数最小化问题和最小残差项 对烟叶进行分级,结果表明本方法可以在保证一定识别率的 前提下有效提高烟叶分级的速度。
基于密度的稀疏表示(DSRC) 1.1 稀疏表示(SRC)原理[7] 稀疏表示算法首先通过训练样本构建字典,然后利用测 试样本对字典的投影进行模式识别。常见的字典构建原理如 下,假设模式分属于 C类,第 i类的训练样本集为: Di=[Di1,Di2,…,Dik,…,Dik],Dik表示第 i类中第 k个 训练样本,Ki表示第 i类的训练样本数目,构成字典矩阵 D= [D1,D2,…,DC];字典构成后,计算测试样本 Y在字典上的投 影 X∶Y=DX,求解 X的计算方法有贪婪追踪法(如匹配追 踪、正交匹配追踪法等)来求解,但不是最优解。目前,最常 用的方法是基于 L1 范数来求解系数矩阵 X: X^1 =argmini ‖X1‖1subjecttoDX=Y; (1) 但是在实际中存在一定的误差 ε,所以在求解系数矩阵 X的公式如下: X^1 =argmini ‖X1‖1subjecttoY-DX≤ε;