2.6 本体技术

2.6.1 本体的概念

  1. 本体是概念化的一个显示的规范说明或表示————格鲁伯(Gruber)(Gruber)(Gruber)
  2. 本体是概念化某些方面的一个显式规范说明或表示————格里诺(Guarino)(Guarino)(Guarino)和贾雷塔(Giaretta)(Giaretta)(Giaretta)
  3. 本体可定义为被共享的概念化的一个形式规范说明————博斯特(Borst)(Borst)(Borst)

这三个定义已成为经常引用的定义,它们都强调了对“概念化”的形式解释和规范说明。同时,反映出本体所描述的知识是具有共享性的

以下是格里诺对“概念化”的理解:

  • **领域空间:**领域空间定义为<D,W><D,W><D,W>,其中DDD表示领域,WWW表示该领域事件最大状态的集合(也称为可能世界)
  • 概念关系:<D,W><D,W><D,W>上的nnn元概念关系定义为 ρn:W→2Dn\ \rho^n:W\to2^{D^n} ρn:W2Dn,表示集合WWW在领域DDD上所有nnn元关系集合的全函数
    • 对于概念上的关系 ρ\ \rho ρ,集合Eρ={ρ(w) ∣ w∈W}E_{\rho}=\left\{\rho(w)\ |\ w\in W \right\}Eρ={ρ(w)  wW}包含$\ \rho\ $可接受的所有外延
  • **概念化:**领域空间<D,W><D,W><D,W>DDD的概念化定义为一个有序三元组C=<D,W,R>C=<D,W,R>C=<D,W,R>,其中<D,W><D,W><D,W>为领域空间,RRR<D,W><D,W><D,W>上概念关系的集合

从上述定义可见,概念化是定义在一个领域空间上的所有概念关系的集合

  • 意图结构:∀w∈W,SwC\forall w\in W,S_{wC}wW,SwC是可能世界www关于CCC的意图结构,SwC=<D,RwC>S_{wC}=<D,R_{wC}>SwC=<D,RwC>,其中RwC={ρ(w) ∣ ρ∈R}R_{wC}=\left\{\rho(w)\ |\ \rho\in R \right\}RwC={ρ(w)  ρR},表示RRR中概念关系的关于www的外延集合
    • 符号SCS_CSC表示概念化CCC的所有意图世界结构,SC={SwC ∣ w∈W}S_C=\left\{S_{wC}\ |\ w\in W \right\}SC={SwC  wW}
  • **模型:**假定逻辑语言LLL具有词汇表VVV,词汇表VVV由常量符号集合和谓词符号集合构成。==逻辑语言LLL的模型定义为结构<S,I><S,I><S,I>,其中S=<D,R>S=<D,R>S=<D,R>表示一个世界结构;I:V→D ∪ RI:V\to D\ \cup\ RI:VD  R表示一个解释函数,把VVV中的常量符号映射为DDD中的元素,把VVV中的谓词符号映射为RRR中的元素

由以上定义可见,一个模型确定了一种语言的特定外延解释

  • 本体承诺:逻辑语言LLL的一个本体承诺K=<C,3>K=<C,3>K=<C,3>定义为LLL的一个内涵解释模型,其中C=<D,W,Rˊ>,3:V→D ∪ RˊC=<D,W,\acute{R}>,3:V\to D\ \cup\ \acute{R}C=<D,W,Rˊ>,3:VD  Rˊ表示一个解释函数,把VVV中的常量符号映射为DDD中的元素,把VVV中的谓词符号映射为Rˊ\acute{R}Rˊ中的元素
    • 如果K=<C,3>K=<C,3>K=<C,3>是逻辑语言LLL的本体承诺,称逻辑语言LLL通过本体承诺KKK承诺于概念化CCC,同时,CCCKKK的基本概念化
    • 已知逻辑语言LLL及其词汇表V,K=<C,3>V,K=<C,3>V,K=<C,3>是逻辑语言的本体承诺,则模型<S,I><S,I><S,I>KKK兼容需要满足一下条件:
      • S∈SCS\in S_CSSC
      • 对每一个常量 c,I(c)=3(c)\ c,I(c)=3(c) c,I(c)=3(c)
      • 存在一个可能世界 w\ w w,对于每个谓词符号 p\ p p,满足III把谓词$\ p\ $映射为3(p)3(p)3(p)允许的外延。即存在一个概念上的关系 ρ\ \rho ρ,满足3(p)=ρ ∧ p(w)=I(p)3(p)=\rho\ \wedge\ p(w)=I(p)3(p)=ρ  p(w)=I(p)
  • **意图模型:**逻辑语言LLL的所有与KKK兼容的模型M(L)M(L)M(L)构成一个集合,称为LLL关于KKK的内涵模型,记作IK(L)I_K(L)IK(L)
    • 给定逻辑语言LLL及其本体承诺K=<C,3>,LK=<C,3>,LK=<C,3>,L的本体是按照使本体的模型集合最逼近与LLL关于KKK的内涵模型集合的方式设计的公理集合
  • **本体:**本体是一种说明形式化词汇内涵的逻辑理论,即一种词汇世界特定概念化的本体承诺。使用该词汇表的逻辑语言LLL的内涵模型受本体承诺KKK的约束
    • 如果存在本体承诺K=<C,3>K=<C,3>K=<C,3>使本体OOO包含LLL关于KKK的内涵模型,那么称语言LLL的本体OOO相似于概念化CCC
    • 如果本体OOO的设计目的是为了描述概念化CCC的特征,同时本体OOO相似于概念化CCC,那么称本体承诺与CCC
    • 如果逻辑语言LLL承诺于某个概念化CCC,以至本体OOO承诺于概念化CCC,那么逻辑语言LLL承诺于本体OOO

2.6.2 本体的组成与分类

本体的组成

在知识工程领域,本体是一个工程上的人工产物,是由用于描述某种确定现实情况的特定术语集,加上一组关于术语内涵意义的显示假定集合构成

概括的讲,一个完整的本体应由概念、关系、函数、公理和实例五类基本元素构成

  • 概念是广义上的概念,除了一般意义上的概念外,也可以是任务、功能、行为、策略、推理过程,等等。
  • 关系表示概念之间的一种关联
  • 函数是一种特殊的关系,其中第nnn个元素对于前面n−1n-1n1个元素是唯一确定的,一般的,函数用F:C1×⋯×Cn−1→CnF:C_1\times\cdots\times C_{n-1}\to C_nF:C1××Cn1Cn表示
  • 公理用于描述一些永真式
  • 实例是指属于某个概念的具体实例,特定领域的所有实例构成领域概念类在该领域中的指称域
本体的分类

从不同的角度出发,存在多种对本体的分类标准

按照本体的主题,当前常见的本体可以分为如下5种类型:

  1. 知识表示本体:包括知识的本质特征和基本属性
  2. 通用常识本体:包括通用知识工程和常识知识库等
  3. 领域本体:提供一个在特定领域种可重用的概念、概念的属性、概念之间的关系以及属性和关系的约束,或该领域的主要理论和基本原理等
  4. 语言学本体:是指关于语言、词汇等的本体
  5. 任务本体:主要设计动态知识,而不是静态知识

2.6.3 本体的建模

构造出一个领域的本体,可以极大的提高计算机对该领域的信息处理能力以及改善该领域的信息共享效果

目前,本体已经称为知识获取和表示、规划、进程管理、数据库框架集成、自然语言处理和企业模拟等研究领域的核心

本体建模方法

建立本体模型的过程可分为非形式化阶段形式化阶段
在非形式化阶段,本体模型是用自然语言和图表来描述的
在形式化阶段通过知识表示语言对文本模型进行编码,形成便于人们交流的、无歧义的、可被软件或AgentAgentAgent直接解释的本体

由于本体工程到目前位置仍处于相对不成熟的阶段,每一个工程拥有自己独立的方法。

例如:尤斯乔德(Uschold)(Uschold)(Uschold)和金(King)(King)(King)的“骨架”法、格鲁宁格(Gruninger)(Gruninger)(Gruninger)和福克斯(Fox)(Fox)(Fox)的“评价”法(TOVE)(TOVE)(TOVE)、伯内拉斯(Berneras)(Berneras)(Berneras)KACTUSKACTUSKACTUS工程法、马德里大学的MethonotologyMethonotologyMethonotology方法、SENSUSSENSUSSENSUS方法、甘唐(Gandon)(Gandon)(Gandon)的五阶段法等

以甘唐的五阶段法为例,说明本体的建模过程:

  • 阶段1:数据收集和分析
  • 阶段2:建立一个字典,获取这些概念的定义
  • 阶段3:对字典进行求精,建立内容更丰富的表
  • 阶段4:用RDFSRDFSRDFS语言描述上述各表
  • 阶段5:定义关系的代数属性,定义知识的推理规则
本体建模语言

语义网(Semantic  Web)(Semantic\ \ Web)(Semantic  Web)技术,使得WebWebWeb上的信息具有计算机可以理解的语义,满足agentagentagentWebWebWeb上异构和分布信息的有效访问、搜索和推理
本体描述语言应满足以下要求:

  1. 良好定义的语法
  2. 良好定义的语义
  3. 有效的推理支持
  4. 充分的表达能力
  5. 便于表达

2.7 过程表示

语义网络和框架等知识表示方法,均是对知识和事实的一种静止的的表达方法,称这类知识表达方式为陈述式知识表达,它强调的是事物所涉及的对象是什么,是对事物有关知识的静态描述,是知识的一种显示表达形式。而对于如何使用这些知识,则通过控制策略来决定

所谓过程表示就是将有关某一问题领域的知识,连同如何使用这些知识的方法,均隐式的表达为一个求解问题的过程。它所给出的是事物的一些客观规律,表达的是如何求解问题。知识的描述形式就是程序,所有信息均隐含在程序中

从程序求解问题的效率上来说,过程式表达的效率要比陈述式表达高得多。但因其知识均隐含在程序中,因而难以添加新知识和扩充功能,适用范围较窄

过程式不像陈述式那样具有固定的形式,如何描述知识完全取决于具体的问题

2.8 本章小结

本章所讨论的知识是人工智能研究的核心问题之一。对知识表示新方法和混合表示方法的研究仍然是许多人工智能专家学者感兴趣的研究方向。适当选择和正确使用知识表示方法将极大地提高人工智能问题求解效率

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐