查字典论文网 >> 关于仿生模式识别技术研究与应用进展探究

关于仿生模式识别技术研究与应用进展探究

小编:孟垂茁

模式识别经过多年的发展,已形成了一系列经典的理论和方法。传统模式识别的目的是将对象( 样本) 进行分类,因此也被称作模式分类,传统模式识别认为所有可用的信息都包含在训练样本集中,考虑的出发点是特征空间中若干类别样本的最佳分类划分,代表性方法有Fisher 判别分析、支撑向量机( SVM)等。这些方法解决了很多问题,并在多个领域得到了成功应用,为科学发展和社会进步做出了巨大贡献,但这些传统方法也存在一些固有的缺陷:

1) 对事物进行学习时通常至少需要两类才可进行区分,例如在人脸检测中,学习的任务仅是人脸这一个类别,但在训练分类器时,分类器需要学习人脸和非人脸两种类型;

2) 已训练好的分类器类别之间的最优分类边界是确定的,若要增加学习新类,则需要重新训练分类器,这将会打乱现有知识( 最优分类边界改变) ;

3) 未经训练类别的样本很容易被误认为是已训练的某一类,分类器不能有效对其进行正确拒识,这是由于分类边界只是将一个无限特征空间划分为多个无限空间。

中国科学院半导体研究所王守觉院士通过分析人类认识事物的特点,提出了一种全新思想的模式识别方法仿生模式识别( biomimetic pattern recognition,BPR)。仿生模式识别认为,事物具有同源连续性规律,即同类事物的两个不同样本之间,至少有一个渐变过程,在这个渐变过程中的所有样本仍属于该类; 也可以这样认为: 同类样本在特征空间中是连续分布的,任意两个样本点之间具有某种连续变化的关系。同源连续性规律是现实中人类直观认识世界的普遍存在的规律,同时也是仿生模式识别方法用于提高对事物的识别能力的先验知识。引入同源连续性规律后,研究仿生模式识别如何对某类事物进行学习,就是研究在高维特征空间中如何对该类样本进行最优连续覆盖( 即对一类样本的识 它不同于传统模式识别方法侧重于别,即如何在高维特征空间中对不同类样本进行最优划分。可见,在特征空间中对某一类样本的分布进行最优覆盖是仿生模式识别的首要目标,覆盖后在特征空间中形成的连续、闭合的复杂几何形体区域赋予该类的属性; 则仿生模式识别的识别过程就是判断特征空间中待识别样本点是否落入此几何形体内。若是,则该样本点属于此几何形体所代表的类别; 否则认为不属于该类。仿生模式识别于2002 年被提出后,被迅速应用到多种识别任务中,获得了有效的识别结果,并展现出独特的优势:

1) 仿生模式识别既能够识,又能够别,对于没有训练过的样本,不会将其错误归为已训练样本中的某一类,而是能够将其正确拒识,实际应用中误识率非常低;

2) 仿生模式识别可以不断学习新事物( 类别) ,并且学习某类时不需要负样本( 非此类或他类样本) 参加训练,学习新类时不需要重新学习已知类,即不会影响原有已经学习好的知识;

3) 仿生模式识别在低训练样本数量情况下仍能获得较高的正确识别率,这得益于引入了同源连续性规律的先验知识,因而有效的信息不再局限于训练样本。低训练样本数、高识别率的特点,更适合一些不易获取大量训练样本的特殊场合下的识别任务。仿生模式识别由于其独特的优点,在国内逐渐受到关注,越来越多的研究机构加入研究队伍,从理论、方法以及应用等多方面开展研究,这些研究机构包括中科院半导体研究所、同济大学、中国农业大学、浙江工业大学、厦门大学、深圳大学、中科院苏州纳米技术与纳米仿生研究所、长沙理工大学、合肥工业大学、吉林大学、西安电子科技大学等众多高校和研究机构。仿生模式识别的研究成果不断涌现,先后用于目标识别、生物特征识别、信号处理、医学图像识别、基因预测和近红外定性分析,涉及机器视觉、安防、农业、生物医学、通信以及互联网等众多领域,获得了有益的效果。2002 年迄今,在国内学术期刊发表的与仿生模式识别直接相关的论文有80余篇,相关的国内硕士和博士学位论文30 余篇,在国际期刊和会议上发表的论文40 篇左右,此外,还有3 本专著出版。仿生模式识别是我国自主创新的方法与技术,从提出至今,已有十多年的发展,但目前还没有对该技术的全面总结。本文旨在对仿生模式识别进行全面的综述。首先介绍仿生模式识别的基本原理,再对仿生模式识别的实现方法进行分析和对比研究,并给出了仿生模式识别在多个应用领域的使用效果,最后探讨仿生模式识别的未来研究方向,希望能够为该方法的进一步发展和实际应用提供参考。

1 仿生模式识别的基本原理

1.1 仿生模式识别的基点同源连续性规律

仿生模式识别把同一类事物称为同源,这里所谓的同一类是指在源头或原理上是相同的一类,而不是拼凑或合并而成的同一类。例如,在手写体汉字识别中,同为简体汉字的手写体认为是同源的; 如果手写体汉字中包含了简体和繁体两种字体,简体和繁体是不同源的,则认为是简体和繁体两类事物的归并。后文所提到的同类,若无特别说明,都是指同源同类。依据上述同源的定义,同类样本之间有如下同源连续性规律:自然界中待认识的事物,若两个事物同类但不完全相等,则可以用一个渐变的或非量子化的过程来描述这两个事物之间的关系,在此变化过程中的所有事物与这两个事物同属一类。同源连续性规律可用数学描述为:在n 维特征空间Rn 中,假设A 为某一同类样本( 事物) 全体的集合,如果样本x,y A,则对于任意0,必定存在一个集合B 满足如下条件:B =x1,x2,x3,x l x1 = x,xl = y,l N,( xm,xm+1) ,1 l - 1 { } A式中( xm,xm+1) 表示样本xm与xm+1间的距离。

1.2 仿生模式识别的学习过程

基于1.1 节的同源连续性规律,两个同类样本间存在连续渐变的关系,并且位于这个渐变过程中的样本点仍属于同一类。仿生模式识别的目标就是把分布在特征空间中的同类样本实现连续覆盖,以二维空间的情况示意图所示。三角形、十字形、圆点表示分别表示三类不同样本,椭圆表示仿生模式识别采用某种覆盖方法在特征空间内形成类别子空间的认识方式。也就是说,仿生模式识别的学习过程,就是特征空间中对同类样本点进行连续覆盖的过程,不同的覆盖算法构成了仿生模式识别的学习算法。通常,特征空间Rn 是n3 的高维特征空间,某类事物样本分布子空间在这样的高维空间中是非常复杂的,实际设计学习算法时,将类别子空间分解为多个封闭的简单几何形体空间( 如图1 三角形类所示,类别空间被分解成多个首尾相接的椭圆) ,则用这些简单几何形体的并近似原来的类别子空间,可使仿生模式识别的学习算法灵活、高效。

1.3 仿生模式识别的识别过程

对于仿生模式识别而言,某一类事物的全体样本点在特征空间Rn 中的连续映射的像所构成的点集( 设为集合A) 是一个闭合的子空间,这个闭合的子空间因实际事物的不同,在特征空间中表现为不同维数的流形。现实中获取到的样本点往往包含噪声,因而实际应用仿生模式识别时,用特征空间中的集合Pa取代集合A; 其中x、y 是特征空间中的点,k 为选定的距离常数。因而,仿生模式识别的识别过程就是判断特征空间Rn 中表示被识别事物的点( 未知样本点) 是否属于集合Pa,其中Pa = ni = 1 Pai,Pai表示第i 个简单几何形体。仿生模式识别的识别过程在二维特征空间中,在二维特征空间R2中,假设A 事物样本点的全体为空间A( 现实中A 无法确定) ,y1、y2为训练样本,采用圆形作为覆盖单元,k 为距离常数,则分别以y1、y2为圆心、k 为半径的两个圆所代表的集合Pa1、Pa2的并构成集合Pa。识别过程即是判断特征空间中的未知样本点z 是否属于集合Pa。若是,则该样本点属于A 类; 若否,则不属于A 类。

综上所述,仿生模式识别与传统模式识别的差别传统模式识别仿生模式识别基本出发点多类样本的区分一类类样本的认识理论基础所有可用的信息都包含在训练集中同源连续性规律数学工具统计学拓扑学学习方法高维空间的空间划分高维空间的复杂几何形体覆盖仿生模式识别为模式识别技术的发展开辟了一条新路径,同时也提出了实现仿生模式识别需要研究的多方面问题,目前的研究主要集中在如下几点:

1) 类别子空间的拓扑流形分析: 仿生模式识别是一类一类地认识事物,在学习某类事物时,需要先分析该类训练样本点的分布,依据同类样本点在特征空间中的分布特性,确定这种分布具有何种拓扑属性,从而确定类别子空间在特征空间中的流形。在确定类别空间的流形及其维数后,仿生模式识别再考虑用何种覆盖方法。

2) 覆盖方法研究: 研究发现,同一类样本在高维特征空间中的分布表现为一个非常复杂的几何形体,虽然具有一定的拓扑流形属性,但要实现对这个几何形体的覆盖会遇到很多困难,例如选择何种几何覆盖单元、如何确定覆盖的顺序、怎样进行连续覆盖等,这也就成为仿生模式识别研究的热点。

3) 识别方法研究: 在确定使用哪种覆盖方法后,识别通常会比较简单,只需计算待识别样本点是否落入特征空间中表征某一类的几何形体内。若是,则将样本点识别为该类; 若否,则认为不属于该类。理论上,不同类事物在特征空间的覆盖形体不会交叉重叠,因此,决不会出现误识。然而,在工程应用实践中,所采集到的训练样本及待识别样本中往往包含不同程度的噪声,特征提取过程中也会丢失一些信息,最终有可能导致类别空间重叠,需要解决处于重叠空间中未知样本的归属问题。除上述几个主要研究方向,也有学者将仿生模式识别思想其他方法相结合,从而提高该方法解决问题的能力。

2.1 样本点分布的拓扑分析

仿生模式识别的核心是覆盖,而分析类别空间的流形是确定用何种覆盖方法的前提。样本点分布的拓扑属性简单分为两种情况,一种情况是拓扑结构是已知的或可以预测的; 另一种情况是拓扑结构是未知的。例如在采集训练样本时,设定严格的采集条件,按照一定的规律或顺序采集,此时,样本点分布的拓扑结构是知的或者是可以估计的。采用了特定的样本采集方式: 摄像头在同一水平面上采集目标的0~360方向的图像,此时目标方向的改变只有一个变量,可认为目标全体样本在特征空间中的分布近似呈环状的一维流形。王宪保等的双螺旋曲线识别任务,识别目标双螺旋曲线是分布在二维空间的一维流形。王守觉、徐健等在一项人脸身份确认研究中,使用三个摄像头组成一组镜头,这一组镜头同时采集同一人脸的图像得到多个样本点,这多个样本点的分布状况部分反映了该人脸在特征空间中的分布状况,后续用一个多权值神经元对这一组样本进行覆盖完成学习。在高维空间中,遇到更多的是拓扑结构未知的情况,目前还没有有效分析高维空间中点分布状况的系统方法和工具,并且流形的维数越高,分析的难度越大,目前的研究大多假定样本呈一维流形分布,在这些实验中,采用一维流形覆盖,都能够取得很好的识别效果。研究了不限定流形维数的仿生模式识别实现方法,研究发现随着覆盖维数的增加,样本的识别率也逐渐提高,但提高幅度逐渐变小。

2.2 覆盖算法研究

覆盖算法的实现是仿生模式识别的研究重点,神经网络被证明是有效的方法。Wang Shoujue,Zhao Xingtao 等提出一种超香肠神经网络,网络由超香肠神经元( hyper sausage neuron,HSN) 构成,HSN 在特征空间中可看成是以两个样本点的连线作为中心线,与中心线距离小于阈值的所有点的集合。在3 维空间中,神经元可看成是一个以两个样本点之间的线段作为中线的圆柱体、分别以两个样本点为球心的半个超球共3 个区域的并,构成一个新的空间区域,因其在3 维空间中像一根香肠,称之为超香肠神经元。王守觉、徐健、LaiJiangliang 等还提出了 函数神经网络: 函数神经网络由多权值神经元组成,而多权值神经元的权值通过样本来确定,一个多权值神经元在特征空间中形成的覆盖区域是依据多个权值矢量共同作用形成的复杂几何形体。因此,多权值神经元覆盖的空间状况是由样本决定的。以三权值神经网络进行人脸身份确认,在误识率为0 的情况下,正确识别率达到96%,实验结果也显示,增加网络规模可提高识别效果。多权值神经元网络用在非特定人语音识别中[18],每个词汇的训练样本数量为30 个的情况下,已训练词汇的误识率仅为1.48%,未训练词汇的误识率为13.29%,而同条件下HMM 方法的误识率为89.24%,远高于仿生模式识别方法。王宪保等使用了两种不同结构的神经元来构造一个三层神经网络,该网络可实现一维流形覆盖; 由于网络的参数是根据样本直接计算得到,网络不存在迭代时间及收敛性问题; 网络的规模也是由样本数量决定的,不存在隐层节点数选择难题。邱立达等将改进蚁群算法引入仿生模式识别的神经网络构造当中,并选取超球作为覆盖几何体。该算法通过设计目标函数、转移概率公式以及信息素更新算法等方法,算出神经网络中覆盖几何体的最优参数; 算法还引入调节因子: 越大,单个神经元的体积越小、神经元数量越多,算法构造的网络的复杂度也就越高、识别率越高; 反之, 越小,单个神经元的体积越大、神经元数量越少,算法构造的网络的复杂度也就越低,识别率越低。在实际应用中可通过调整 的取值来平衡网络的性能和复杂度,以满足不同需要。胡静等基于神经网络模块化编程思想,提出了一种实现仿生模式识别的三层前向神经网络结构设计准则,即: 采用单隐节点层结构,网络的输入层与隐节点层的连接方式为全连接,将隐节点层划分为C 个子节点组,且各个子节点组只与其相应的输出层节点相连接。其中C 为学习样本的基元素数目,实验比较了严格按照该准则设计的网络与未按照该准则设计的网络在交通标识符形状识别中的效果,隐节点分组时,网络收敛次数更多、识别率更高且训练时间更少,识别速度更快。其他神经覆盖方法研究提出的类高斯混合模型的神经元覆盖方法,王改良等利用动态聚类的方法寻找到每个覆盖区中心,然后用多权值神经元进行覆盖等。

从高维形象几何的观点出发,研究采用多个简单几何体进行局部覆盖,再通过对简单几何体合并或相交的方法,可实现对复杂几何体的覆盖。实际上,从广义神经网络的角度看,简单几何体可以看成是一个神经元,而多个几何体的并或交可看成是多个神经元构成的神经网络。从这个意义上看,神经网络方法和高维形象几何方法是相通的。杨国为等采用高维空间点分布分析方法,给出从数学上证明了找到满意的几何覆盖形体的方法。王宪保等运用高维空间几何理论和流形学习理论,在不需要限定流形维数的情况下,研究了具体实现训练样本的覆盖方法及测试样本的识别方法,并对覆盖维数以及与识别性能之间的关系进行了分析; 并将该实现方法应用在语音识别中,取得比传统的HMM和最近邻法( 零维覆盖) 都要高的识别率。实验还表明,提出的方法对未学习人的语音样本的正确识别率提高更显著; 随着覆盖维数的增加,样本的识别率也逐渐提高,但提高幅度逐渐变小; 由于点到覆盖体距离的计算是个递归的过程,随着维数的增加,计算量呈级数的增长,综合考虑识别率和识别时间,本文认为二维覆盖是合适的选择。另外,Cao Wenming等系统研究了仿生模式识别的几何代数方法,还研究了多光谱图像的仿生模式识别理论和方法。

2.3 重叠空间中样本的归属判别

武妍等研究发现实际情况中,仿生模式识别为了提高识别率而增大阈值或训练样本增加时,不可避免地出现空间重叠。为了解决处于重叠空间中的未知样本的归属问题,文献提出了适当增大阈值以及允许大样本情况下的空间重叠,在出现空间重叠的情况下,采用相对子空间划分的决策方法( relative division of overlapping space based biomimetic pattern recognition,RDBPR) ,即通过计算重叠空间中样本到各个特征子空间的距离,得到距离相对最小的类别并将其归类。RDBPR 方法能够在不增加误识率的基础上,提高对处于重叠空间中样本的识别能力,从而提高最终识别率。文献的实验结果表明,在训练样本数量较少的情况下,即空间覆盖的几何形体体积较小时,与BPR( biomimetic pattern recognition)相比,RDBPR 未显示出明显的优势; 但随着训练样本数量增加,在保持较高的稳定性和不显著增加误识率的前提下,RDBPR 比BPR 的识别率更优。丁杰等[28]给出了通过计算基于类条件的后验概率对样本进行相对区别的判别规则,依据待识别样本与各类别子空间的相对距离做置信评估,根据各类模式散布计算后验概率,实现因空间重叠造成拒识的样本的相对划分,提高识别率。

2.4 其他仿生模式识别实现方法研究

由仿生模式识别学习过程可知,训练样本的代表性是进行有效学习的前提,然而在实际情况中由于某些原因,训练样本可能包含有不属于本类的离群样本,会对学习结果产生不利影响; 此外,由于多种内外因素的共同影响,采集到的同类样本都会含有不同程度的噪声成分,噪声过大的离群样本通常会导致学习效果变差; 另外,大规模的训练样本通常会有冗余,冗余样本的存在使学习时间增加而对学习效果提高不大。丁杰等[28]采用仿射传播聚类( affinity propagation,AP) 算法对样本进行聚类去除离群样本,获得更优的识别结果。王改良等[22]利用迭代自组织数据分析方法对训练样本进行动态聚类,寻找到同一类的多个小类覆盖区中心,然后用多权值神经元网络覆盖小类,实现该类的整体覆盖。此外,还有一些研究,将仿生模式识别思想与其他方法相结合,获得更优的算法效果。赵莹等以仿生模式识别的同类样本之间同源连续性为基础,推广了传统的最邻近方法。利用样本点分布的先验知识增加训练样本数量,再通过由多个超球体的并所形成的几何形体,覆盖可能的样本点。该方法不但能够更加准确地识别同类样本,还能对非本类样本进行拒识,有效地提高了传统最近邻方法的识别效果。王丹等[30]提出了一种多维多分辨仿生识别方法,其特点是用多分辨分析方法来获取特征空间的多分辨表示,并将HOG( histogram of oriented gradient) 描述符用于多尺度分析,获得鲁棒性强、稳定性好的多尺度的特征表示,再通过SOM( self-organizing map) 聚类的方法实现了多尺度的样本在特征空间中的覆盖; 识别过程给出了一种核函数的多尺度融合决策的识别方法,判定待识别样本是否属于相应的样本空间拓扑覆盖。殷建等[31]从纯数学角度给出基于矢量量化的仿生模式识别算法,并列出了如何进行划分的具体算法和公式。殷维栋阐述了主方向神经网络及覆盖框架的概念,通过分析及实验,说明了主方向神经网络的原理,通过获知训练样本的细节分布,降低了主方向神经网络的噪声敏感度,获得了较好的映射逼近性能,从而具备一定的鲁棒性。但如何选取可调参数、如何确定隐层的神经元数目是主方向神经网络需要解决的问题。

3 应用研究

相比仿生模式识别的方法研究,技术应用研究更受关注,其研究成果更为丰富,包括目标识别、生物特征识别、近红外定性分析、信号处理、医学图像识别和基因预测等,涉及计算机视觉、安防、农业、生物医学、通信以及互联网等领域。仿生模式识别技术的通用性及有效性使其在众多应用中展现出活力,在众多的研究中,仿生模式识别都获得了比传统模式识别更优的综合性能。与此同时,仿模式识别对未训练样本的极低误识率以及低训练样本下高识别率的优点更为突出。下面将按照技术分类对这些技术应用研究进行总结。

3.1 目标识别

仿生模式识别最初应用在目标识别,王守觉用仿生模式识别方法识别观察方向水平的全方位( 360) 实物模型,实验采用14 个实物模型,其中训练8 个模型,另外6 个用来做未训练类样本误识率测试,实验显示,已训练类的样本正确识别率达99.75%,而未训练类样本的误识率为0。此外,他还研究了斜视方向的目标识别,仿生模式识别的正确识别率达99. 89%,误识率仅为0. 11%。刘焕云等将仿生模式识别应用于灰度图像目标的识别与跟踪,实验结果表明,该方法对于目标尺寸渐变的视频图像序列中的目标识别与跟踪是有效的和稳健的。在地面声目标识别实用系统中,目标误识率更为关键。黄琦等基于二权值神经元网络实现仿生模式识别的地面声目标识别,在训练样本数为200 的情况下,仿生模式识别的正确识别率与GMM、BP 网络和RBF 网络相当,在90%左右; 而当训练样本数下降到80 时,仿生模式识别的正确识别率为82.5%,远高于其他3 种方法( 其中识别率最高的方法约为74%) 。实验表明,仿生模式识别有效克服现有识别系统中误识率高、低训练样本数量情况下识别率低、系统需重复训练等缺点。

3.2 生物特征识别

生物特征识别是利用人的生理特征或行为特征来进行个人身份识别的统称,常见的有人脸识别、语音识别、虹膜识别等。仿生模式识别应用在人脸识别是研究的一大热点,这些研究包括1 ∶1的人脸身份确认和1 ∶N 的人脸识别。王守觉、徐健等[17]采用多镜头信息融合,建立多权值神经网络的仿生模式识别方法进行人脸身份确认,正确识别率达到96%,其余4%均为拒识,无一误识。王守觉、曲延锋等研究了仿生模式识别在ORL 人脸库上的人脸识别效果,特征提取采用PCA 方法,获得了误识率为0 的识别效果,而在同样实验条件下,SVM 方法的误识率为6%; 实验结果表明仿生模式识别方法优于SVM 方法及最近邻方法。莫华毅等采用灰度微分的特征提取方法研究人脸的仿生模式识别;

蒋加伏等采用PCA 与LDA 的特征提取方法研究人脸仿生模式识别; 周书仁等[39]采用DCT 与LDA的特征提取方法研究人脸仿生模式识别; 陈勇研究了基于二进小波变换的人脸仿生模式识别; 庄德文等研究了基于LOG-GABOR 滤波二值变换的单训练样本人脸仿生模式识别。这些研究方法与其他经典方法相比,误识率更低,综合性能更优。此外,翟懿奎等采用基于局部相位量化( local phase quantization,LPQ) 特征提取结合仿生模式识别的方法,对伪装人脸识别进行了研究,该方法优于SVM、SRC 及PCA+BPR 方法,实验结果证明这种方法具有较高效率,同时大大地提升了伪装人脸识别的性能指标。XU Ying 等[43]则采用了LBP+LPQ 特征提取及超香肠神经网络覆盖来识别伪装人脸。仿生模式识别应用在语音识别的研究也较多,并取得了不错的效果。覃鸿等以MFCC 作为语音特征参数,对较低数量训练样本情况下非特定人语音的仿生模式识别进行了研究,并将其与其他常规语音识别方法如HMM 及DTW 进行了比较,每类18 个训练样本时,仿生模式识别对未训练类的误识率为13. 92%,远低于HMM ( 95. 57%) 及DTW( 93.67%) ; 研究表明仿生模式识别方法在训练样本数量较少的情况下,就能获得很好的识别效果,而且对于未训练过的词组有较高的正确拒识率,综合性能优于另外两种方法。王守觉、潘晓霞等提出了一种基于动态搜索的连续数字语音仿生模式识别方法,该方法鲁棒性强,适合长短不同、语速不同的连续数字识别。王改良采用基音频率轨迹作为声调特征,研究了基于仿生模式识别的四种声调识别,仿生模式识别的覆盖单元采用多权值神经元网络,实验与HMM、SVM 和BP 方法比较,在大训练集下识别率最优,为99.1%; 在小训练集下识别率为98.5%,远优于其他方法( 其他方法SVM 最优,为95.2%) 。张卫强等采用归一化的短时子带平均幅度谱作为特征,研究了基于仿生模式识别的固定音频检索方法,并取得了综合性能优良的实验结果。此外还有说话人识别、小词汇量语音识别、问候语识别。另外,李晗等将仿生模式识别应用在声音的性别识别,采用WSJ 英文语音数据库,以基音频率为特征,男性和女性的训练样本各为50 个,测试样本为850 个,覆盖单元采用类高斯混合模型神经元,取得了比HMM 更优的识别效果; 改用训练样本100 个、测试样本500 个的实验条件,特征维数为100 维时仿生模式识别达到最优,男性识别率达到100%,女性识别率为98.2%。在虹膜识别方面,翟懿奎等[55]研究一种基于仿生模式识别理论的虹膜识别算法,该识别算法基于小波变换及奇异值分解的方法进行虹膜特征的提取,再利用超香肠神经网络进行覆盖学习。在中科院自动化所的虹膜数据库( CASIAver-1.0) 上进行仿真实验,取得了良好的正确识别率,并且对于未参与训练的待识别虹膜样本具有较高的拒识率。XUYing 等也对虹膜的仿生模式识别进行了研究。王丹等将仿生模式识别用于虹膜识别,在JLUIRIS数据库上获得了良好的识别效果。而LI Zhihui等则研究了基于仿生模式识别的多尺度虹膜识别。仿生模式识别在生物特征识别的其他方面还有李颜瑞等研究的一种基于仿生模式识别的眉毛识别方法,采用小波变换提取眉毛特征和三权值神经网络覆盖学习,在一个有120 人的眉毛信息库上进行实验,最高识别率达91.67%。

3.3 文本识别

文本识别方面,丁杰等将仿生模式识别应用在手写体数字识别中,数据库使用了NUST 手写金额库及Concordia 大学的CENPARMI 库,与KNN、SVM 和通用分类器学习框架方法比较,仿生模式识别方法的可靠性最佳,在小样本识别情况下,比传统模式识别更具有优势。王建平等提取手写体汉字的笔画特征,采用双权值椭圆形神经元覆盖方法进行手写体汉字识别,通过对SCUT-IRAC 手写体汉字库中的简单和较复杂手写体汉字识别进行的仿真实验,验证了该方法具有接近人类识别汉字的容错性和准确性。ZHANG Jibin 等使用仿生模式识别进行文本分类,实验结果显示三权值神经元网络的效果最优。此外,胡静等研究了仿生模式识别的交通标识符识别,取每类标识符的10 幅图像作为训练样本建立相应的仿生模式识别网络,用另外6 幅作为测试样本,识别率最高可达95.47%。

3.4 近红外光谱定性分析

仿生模式识别应用在近红外光谱定性分析农作物种子品质方面。中国科学院半导体研究所和中国农业大学做了大量的研究工作,研究人员基于近红外漫反射或漫透射光谱,进行了仿生模式识别种子识别。群体玉米种子品种鉴别方面有苏谦等研究基于仿生模式识别的玉米品种快速鉴别方法,7个玉米品种的平均正确识别率达94.3%,同时正确拒识率达99.1%; 邬文锦等在37 个玉米品种上的实验结果平均正确识别率达94.3%; 卢洋等在近红外短波段采用仿生模式识别方法对37 个玉米品种进行识别,获得97. 6% 的正确识别率; 曹吾等研究了采用仿生模式识别方法建立的7 个玉米品种近红外定性模型的稳健性与适应性; 柳培忠米品种近红外定性模型的稳定性。单粒玉米种子品种鉴别方面,贾仕强等采用仿生模式识别方法建立定性鉴别模型,研究了单粒玉米种子品种真实性鉴定的光谱测量方法。贾仕强等还采用仿生模式识别方法,研究了带种衣剂玉米种子的品种鉴别方法。黄华军等则采用仿生模式识别方法研究了玉米杂交种纯度的近红外光谱分析技术。此外,翟亚锋等利用仿生模式识别方法建立近红外定性分析模型,研究了转基因小麦快速鉴别方法。上述研究都获得了优于传统近红外定性分析方法的鉴别效果,值得一提的是,其中一些应用研究成果已成熟并开始在企业中推广。

3.5 其他应用

在生物信息学方面,陈阳等利用仿生模式识别原理,采用超香肠神经元网络对水平转移基因进行识别,结果显示仿生模式识别方法对大肠杆菌( Escherichia coli K12) 基因组的命中率与目前预测结果最好的八联核苷酸频率的打分算法相比,提高了42.3%,与基于支撑向量机的识别算法相比提高了30.5%。安冬等提出了一种物种自动分类的方法。该方法利用仿生模式识别对嗜肝病毒科病毒及花椰菜花叶病毒科病毒实现自动分类,达到了较高的识别率。SU Qian 等研究了基于仿生模式识别的细胞代谢周期识别方法,对酵母的代谢周期的三个阶段,分类正确率分别达到90%、100% 和100%。在医学影像识别方面, JIANG Jiafu 等和吴海珍等研究基于仿生模式识别的医学图像分割算法,算法采用3 多权值神经元网络在高维特征空间中对样本进行最优覆盖,然后对覆盖结果进行识和分割,利用该方法得到的实验结果比传统图像分割法准确性更高、可靠性好、泛化能力强。何中市等研究基于仿生模式识别的孤立性肺结节检测方法,实验在小样本集上进行,并与BP 神经网络和SVM 方法进行比较,从特异性、敏感性等几个指标对实验结果进行比较分析,仿生模式识别方法的综合性能最优。武妍等研究运动想象脑电识别,采用增量半监督的仿生模式识别算法,使用脑机接口国际大赛公布的数据集对该算法进行了离线分析、模拟在线实验,以及作者在线采集的实际脑电数据进行了实际在线实验。实验结果表明该算法平均准确率高,并且其在抗过学习和稳定性上也体现出了明显的优势。YANG Xiaoli 等研究了仿生模式识别的乳腺癌预测方法,癌细胞转移、预后良好及预后不良的的预测率分别为85%、98%及88%,均优于Fisher 判别分析及SVM 方法。

在信号处理方面,安冬等分别采用自相关特征提取方法和PCA/ICA 特征提取方法,研究了基于仿生模式识别的DOA 估计,实验结果证明仿生模式识别不仅可以应用于传统的模式识别,还可以应用于非感性的抽象对象的信息处理,并且模型鲁棒性强,计算量较小,在信号处理领域具有普遍意义。在图像识别方面,蒋加伏等研究了基于仿生模式识别的纹理图像识别算法,采用Contourlet 变换提取图像能量特征和超香肠神经网络,在Vistex 纹理库上进行仿真实验,分类正确率为100%,优于SVM、k 均值和BP 方法。耿春云等将仿生模式识别用于海洋微藻识别,实现了不同种及同种不同状态下的藻体的准确识别。胡静等研究了仿生模式识别的交通标识符识别,取每类标识符的10 幅图像作为训练样本建立相应的仿生模式识别网络,用另外6 幅作为测试样本,识别率最高可达95.47%。故障诊断方面,SHI Haitao 等研究了基于仿生模式识别的电潜螺杆泵状态识别,通过识别电潜螺杆泵的电参数状态来进行故障诊断,正确识别率为86.7%,获得了有效的识别效果。WANG Xiaozhe等[将仿生模式识别与匹配跟踪算法相结合进行电路系统的故障检测仿真实验,实验结果表明该方法提高了故障检测的鲁棒性和识别精度。网络攻击识别方面,周全强等针对有监督方法,研究了基于仿生模式识别的未知推荐攻击( 用户概貌攻击) 检测方法,用于MovieLens 数据集实验中,结果表明该方法具有较高的命中率和较低的误报率。在时间序列匹配方面,闾海荣等基于仿生模式识别思想,利用同类样本间的连续性规律,对时间序列进行排序,将若干新时间序列添加进相邻的时间序列之间,用这种方法增加样本点的数量。实验结果表明,这种方法比基于动态时间弯折的方法更有优势。

4 结束语

仿生模式识别自2002 年提出,为模式识别领域开辟了一条全新的研究方向,诸多学者已经相继提出了一系列具体实现方法并将其广泛应用在模式识别的各个领域。与此同时,将仿生模式识别思想应用在其他信息处理方面,扩大了仿生模式识别研究的范围,拓展了仿生模式识别研究的内容,使仿生模式识别可以解决更多领域的新问题。从目前仿生模式识别的方法研究及应用研究可以看到,还没有有效的分析同类样本点分布流形的方法,还需要发展高维空间拓扑理论与算法,以及更灵活高效的神经元模型等。仿生模式识别优于传统模式识别,且具有光明的研究前景,但是也应清晰认识到,该方法亟待开展深入细致的研究,将该方法及其应用研究向更深层次和更广领域推进。

热点推荐

上一篇:变电站智能辅助控制系统协议测试软件的实现研究

下一篇:如何对幼儿进行德育教育论文 幼儿园关于德育教育之类的论文