基于语义数据模型的木材识别方法

 基于语义数据模型的木材识别方法王锋,徐魁梧(南京林业大学)模型方法把对象属性进行分解及组合,把属性域分为名称型、程度型、数值型和描述型,对属性域进行系统化、数字化和图形化。采用图形灰度表示取值概率和判断概率,建立并应用木材识别语义数据模型,以提高木材识别智能化程度。经检验,该方法快速、准确,具有较强的模糊识别能力。

  木材识别是指根据木材的构造等识别特征,采取一定的方法和步骤鉴定木材树种的过程。木材识别在木材生产、加工、经营、保护、司法、考古等领域具有重要作用。随着木材市场的扩大,依靠经验进行木材识别已经无法满足要求,因此,有了检索表识别法、穿孔卡识别法、识别卡识别法12、数据库查询识别法>3,4,以及图像识别法等方法,这些方法在木材识别中发挥了重要作用。

  随着计算机、人工智能以及网络技术的飞速发展,中文信息处理技术渗透到很多学科之中,为实现木材智能化识别提供了新的途径。同时随着我国木材生产、贸易、消费的日益繁荣,对木材识别提出了新的要求。笔者利用语义数据模型(Semantic DataModel,简称SDM)的方法,通过构建木材识别SDM,提高木材识别智能化水平。

  1木材识别语义数据模型的建立1.1收集归纳木材识别特征数据不同树种木材在形态、构造及生理特征上既有共同点,也有不同点,这就构成了木材识别特征。木材特征,一般由表及里,由原木到木材,由简及繁,由宏观到微观,由主要特征到次要特征,逐步识别。笔者以《IAWA木材光学显微镜的特征》为标准确定木材识别特征,并以为识别特征数据来源。

  收集归纳数据时遵循系统原则、规范原则和简洁原则。首先确定基础数据结构;然后采用二维表南京林业大学学报(自然科学版)序号木材识别项目木材识别项目取值中文树种名称三尖杉/柏木/福建柏/侧柏/圆柏/银杏/冷杉/杉松冷杉/银杉/云南油杉/……

  心边材区别无/不明显/略明显/明显/甚明显生长轮个数(每厘米数值)管孔类型环孔材/半散孔材/散孔材/辐射孔材/切线孔材/交叉孔材格,二维表中的3列分别是序号、识别项目、项目取值,按照顺序,逐步增加特征项目及项目取值;其次依照木材树种顺序,对照识别项目名称,一次列出识别项目取值;不断增加木材识别项目;根据语义聚合关系分析中多义、同义、反义、并义、位义、类义关系进行分类归纳,把重复和同义的项目取值进行合并;最后,对木材识别项目及项目取值的系统性、规范性、简洁性进行检查及调整。收集归纳的结果举例见表1. 1.2确定木材识别语义数据模型结构木材识别特征是人们对木材客观属性的认识,由于语义数据模型11()提供了系统分析的方法,可对木材识别特征进行描述,使木材特征的数据变成可供识别的信息,因此,采用该模型作为建模工具。

  SDM通常是指具有支持非结构对象、联系及其语义的表达、数据抽象的网状或层次结构,具有推导或继承性、完整约束、动态建模等能力的数据模型,可以提供更丰富、更具有表达能力的概念与技术,以便在更高层次上对数据对象的性质和联系关系做出清晰和简明的描述,使模型获得更多的语义含义,以更抽象、方便的形式操纵数据。SDM由语义对象、属性、属性域等组成,木材识别SDM由语义对象(木材树种)、对象属性(识别项目)及属性域(项目取值)构成。

  为具体描述木材识别SDM的结构,对有关集合约定如下:设A是SDM的语义对象,即A=ai,an;设B是SDM的对象属性,即B=bi,/,/W,设C是SDM的属性域,即C=ci,C2,Cn,利用语义学相关原理对属性域进行量化。为提高智能识别程度,设特征取值概率集合为D且判断概率集合为E,则木材识别SDM的结构可以描述为:i=1,2,n. 1.3木材识别语义数据模型组成要素的数量化(1)语义对象:木材识别SDM中的语义对象为木材的种、属或科,中文科名、同科种名按照汉语拼音音序排列,分别对科、种进行顺序编码。

  (2)对象属性:在木材识别SDM中,对象属性主要是指木材识别时选择的描述对象,如“心材颜色”、管孔类型“等。由于木材‘科”与/种“存在着位义关系,正确分析对象属性及其属性域是准确识别木材的关键。木材树种的属性多为偏正词组,为便于排序及扩充,利用语义学中义素分解的方法将属性分解为识别主体和主体性质两部分。识别主体是指木材识别时重点观察的部分,根据木材识别特征归纳结果顺序列出木材识别主体。从便于实现对属性域的排序和数量化的角度出发,利用位义关系原理把木材属性分为名称型、数值型、程度型、描述型4类,在此基础上,列出木材识别主体性质编码。可以利用主体性质所在的行与列的数字编码组合表示,先行后列。该种组合表示方法具有良好的扩充性,可以根据识别获取的特征对照已有识别主体性质进行增加。在识别项目分解的基础上,通过把识别主体和主体性质组合起来,就构成完整的识别项目。基于以上设定,可以列出木材树种属性的所有对应编码。

  (3)属性域:是木材识别SDM的重点组成部分,是指属性可能取值的集合。根据属性的分类,对应的属性域可分为名称型、数值型、程度型、描述型4类。

  名称型属性域的特点是彼此之间存在位义关系,由单个要素构成一个集合,同一层次内一般没有严格的顺序性和必然的联系。语义量化时需注意:名称要齐全,对不便于覆盖的地方用/其它“来概括;名称的位义关系在实现模糊判断时具有重要作用;注意名称的对应条件。在对名称型属性域语义量化时,首先确定名称型属性域的层次结构;按照位义关系列出并义关系的名称,顺序排列同层次名称;对名称进行系统编号。

  数值型属性域属于定量判断,可以用数学的方法进行分析和处理。语义量化时需注意:数值的精度要统一;要明确数值区间是否包含端点值;数值的单位采用国际单位制,允许无单位数值。首先确定数值型属性域的名称,其次明确数值的区间、端点值、精度及单位,有联系的数值之间要将关联关系标出。

  程度型属性域需要依靠人的逻辑判断,这种判断具有一定的范围和模糊性。语义量化时需注意:判王锋等:基于语义数据模型的木材识别方法断的标准要统一;判断的尺度要适当。由于木材是生物材料,变异幅度较大,考虑到定位和表述的难度,把程度型属性域划分为5级,其中,0表示/无“此特征,从1~ 5级依次表示程度加强。

  描述型属性域彼此之间存在位义或并义关系,由若干个元素构成一个集合,同一层次间一般没有严格的顺序性,是木材识别特征项目取值中较为复杂的一类。语义量化时需注意:确定描述型属性域的范锾对暂时描述不到的地方,用/其它‘来概括;在位义关系中同一层次的描述型项目应具有统一的描述规则;根据一定的顺序排列,可以按习惯顺序、字母顺序、音序等进行排列。首先确定描述型属性域的层次结构;再按照位义关系列出取值,按一定顺序排列同层次取值,并对取值进行编号。

  1.4构建木材识别语义数据模型(1)形式化描述:设A;是A的子集,隶属于属、科,根据SDM的推导和继承性,凡属于A;的属性域必然包含于的属性域,而属于的属性域必然包含于N;的属性域,可见在A;之间存在映射关系,建立木材识别SDM是从A,MiNi,而进行木材识别时是从Ni―Mi―Ai.采用取值概率D表示木材属性域在具体的语义对象中具有不同的分布概率,采用判断概率E表示识别时的概率。综上所述,可以将木材识别SDM描述为:(2)图形描述法:把木材识别SDM的语义对象、对象属性和属性域表示在同一个直角坐标系中,可以根据属性域分布绘出特征图形,使木材特征图形化,从而使判断更加形象直观,如所示。

  形式化描述方法精确、严谨,易于系统以后的实现,但难以掌握和理解,模型可读性差。图形化方法直观、自然,易于描述系统的层次结构和功能组成,且简单易学,通常还有工具软件支持,因而成为主要描述工具,但这种方法的精确性和严谨性不够。

  2应用语义数据模型进行木材识别2.1木材识别方法(1)基于SDM的木材识别方法:假设已建立基于SDM的木材识别系统,现对某一未知木材树种Ai进行识别,首先进入基于SDM的木材识别系统,确定进行识别的主体及性质Bj.,获得识别特征Ci,同时确定获得该特征的取值概率Di,输入Ci,Di,出现符合已知条件的集合,重复获取特征,可逐渐缩小树种范围,直至判定Ai的名称,给出识别概率Fi,再核对木材标本后即可确认。

  (2)属性域的运算:包括名称型、数值型、程度型及描述型运算。

  名称型属性域运算主要包括等于、NOT、包含运算等。等于运算,表示属性和属性域之间判断成立。例如,树种银杏的科名Ea=银杏;NOT运算,表示所要识别项目和取值之间判断不成立。例如,树种银杏的科名EaX银杏;包含运算,表示属性和属性域之间存在着包含关系。例如,三尖杉、海南粗榧、粗榧3个树种都属于三尖杉科,也就意味着这3种树种的项目取值的集合构成三尖杉科的特征集合。

  数值型属性域运算主要包括等于、大于、小于、不等于、区间运算、包含运算等。大于运算表示属性域取值大于一定范围。例如,木材密度>1.2g/cm3,可以列出符合条件的全部树种;区间运算表示属性域位于某一特定区间内。例如,木材密度为1.1~1.3g/cm3,可以列出符合条件的全部树种。

  程度型属性域运算经过语义量化后,程度型属性域可以参照数值型属性域进行,并且可以实现一定程度的模糊判断。进行模糊判断时,要确定模糊判断的区域,可以通过设定中心值及邻域的方式进行。

  描述型属性域运算经过语义量化后,可以参照名称型属性域进行,主要进行等于、不等于、包含运算等。要真正解决描述型属性域运算的模糊识别问题,关键在于把描述型项目取值在系统编码的基础上进一步深入地量化。例如,描述木材颜色时,如果全部转化为数字表示,则可以利用数理统计方法进行精确描述和模糊识别。

  2.2识别过程探讨南京林业大学学报(自然科学版)(1)数据请求:是指在未能具体判断到一个树种时,可以通过数据对比,请求识别者给出具有识别价值的数据,有利于识别者按照合理的方向进一步收集数据,尽快完成识别任务。数据请求的方法:经过判断后产生几种树种Ai,任选A1和A2,计算A1和A2的差值,列出差值不相同的B项,推荐数值差别较大的B项作为优先识别的项。

  (2)关键特征识别:在全部树种Ai中,某一项B对应的C值只有一个或数量很少,则B项就成为该树种的关键识别特征。根据关键特征进行识别,可以有效提高识别的速度和准确程度,更加符合人的直观判断的特点。

  (3)数据相似性判断:根据被识别树种Ai已知B项的C值,可以计算Ai与已知树种A,的各项C值相似的程度。设Ai共有Bi项,其数值为Ci,表示属性域长度或面积的平均值,N(i)表示相似程度,则两者之间的相似性计算为:(4)木材特征图形:设描述某木材特征的属性域为,采用相对单位度量的方法把属性域取值放在同一直角坐标系中,则形成一条曲线,称为木材特征图形。例如,某已知木材Ai特征值分别性域的平面坐标系如所示,以Bi为X轨Ci为Y轴,则该图形称为树种Ai的木材特征图形。

  3结语在传统识别方法中,木材识别特征较为分散,彼此间缺乏有机联系,没有语义解释,无法实现模糊识别。通过构建木材识别SDM,对木材识别特征进行系统分类和量化,便于实现一定程度的模糊识别。因基于SDM的识别方法是建立在语义学的基础上,具有较强的适用性,因此,该识别方法具有较大的推广价值。描述型属性域是自动识别的重点,由于语义本身的局限性,描述型属性域必须通过进一步精确细分,才能充分发挥计算机辅助识别的作用,特别是在图像识别领域具有极大的潜力。


喜欢请点赞
我已经到底了

信息提示

5秒后自动关闭