顶级本体在解决元数据挑战中的作用

描述

这个由多个部分组成的系列满足了对支持物联网 (IoT) 以及建筑物、企业和消费者的数字化转型的单一语义数据模型的需求。这样的模型必须简单且可扩展,以实现即插即用的互操作性和跨行业的普遍采用。

什么是本体论?

本体论作为科学的一部分,有很多面孔。最初,本体论是关于“存在”的哲学的一部分,或者说是描述世界的对象、现象和规律的宇宙知识体系。

近年来,本体的发展已经从人工智能(AI)领域转向语义网。Web上的本体范围从对一般Web内容进行分类(例如 schema.org)到对待售产品及其功能(例如 amazon.com)进行分类。

作为语义互操作性的促进者,本体提供了与特定领域(例如医疗保健)的元数据标识符相关联的概念的标准化分类。在结合分类法和同义词库的特征的同时,本体论在术语和属性之间使用严格的语义关系,目的是以机器可读的形式表示知识(图 15)。

物联网

[图15 |语义级别]

用于开发本体的方法对于促进可伸缩性至关重要,并且必须考虑所有相关的应用程序。本系列文章考虑的应用包括五个相互关联的行业的业务和物联网用例 - 家庭和建筑,能源,零售,医疗保健和运输和物流。

虽然语法语言(如OWL,RDF和RDFS)可用于构建本体,但本系列的第三部分将重点介绍与任何特定建模语言无关的方法。

一个受控的词汇表,确保一致性

受控词汇是精心挑选的单词和短语(即术语)的集合,这些单词和短语被赋予了明确定义的含义,这些含义在上下文中是一致的。词汇表可用于保持本体发展的一致性,本体论定义了术语背后的上下文关系。

由登记当局控制的词汇表中的所有术语都应有一个明确、非冗余的定义。如果可以使用多个术语来表示相同的内容,则应将其中一个术语标识为受控词汇表中的首选术语,其他术语作为同义词或别名列出(如图 16 和术语表所示)。

受控词汇表应为全球应用程序提供本地语言支持。代表知识领域内术语的标准词汇表已经可以从各种组织(例如,lov.okfn.org)免费获得。

物联网

[图16 |带有别名和翻译的受控术语]

每个事物的对象类

本体可以通过类的集合提供域概念的标准化分类。每个类(概念)可以表示一个可以唯一标识的类似事物或对象的类别。定义类以反映其对象(实例)所特有的属性、限制和关系。类可以表示物理对象(如传感器和人员)以及信息对象(如业务事务 [ISO 11179)。本体与一组单独的类实例一起构成了知识库。[8]

类的层次结构

与分类法一样,本体可以在分层结构中定义其类,该层次结构可以根据需要尽可能深(图 17)。一个类(如传感器或执行器)可以是另一个类(设备)的子类(类型)。

物联网

[图17|本体的分层结构。

所有子类都继承其类的属性。例如,如果电源状态是 Device 类的一个属性,则所有传感器和执行器对象都将具有此属性。

属性附加在适用于其所有对象(包括子类)的最一般类中。由于所有类都是对象类型,因此类层次结构具有一个根类 Object,该类包含由所有对象继承的属性,如 Identifier(O-DEF 分类属性)(请参见图 19)。

虽然这种方法与面向对象的编程并行,但它代表了编程的元数据抽象。表示本体的元数据可以维护在存储库(ISO 11179)中,该存储库完全从任何编程环境中抽象出来。

跨行业互操作的顶级

顶级对象类(例如,ODEF核心索引)可以促进不同领域(例如,建筑物,零售,医疗保健)之间的数据交换和互操作性,因为它们确保以统一和语义兼容的方式使用基础术语。

本系列中确定的联盟的语义数据模型包括支持其目标行业和用例的顶级类(图 18)。

物联网

[图18|联盟顶级对象类。

虽然术语可能不同,但联盟有许多共同的基本概念(类)。这些概念的“混合”可以形成一个顶级本体,能够支持行业特定的用例和跨行业的互操作性(图 19)。

物联网

[图19 |混合的、跨行业的顶级类层次结构。

根 Object 类的“名称”和“说明”属性可以描述这些顶级类,并包含在术语表中:

信息模型

资产

产品

位置

交易

系统

过程

统治

事件

关系

虽然个人和组织被一些财团模型(O-DEF,schema.org)视为顶级类,但它们都是商业模式中派对概念的子类(GS1 EDI,ARTS ODM)。参与方类包括个人和组织共有的属性,并使一个类能够与业务事务和其他关系相关联。[9]参与方能够拥有合法所有权,并且可以与根对象类的所有者参与方属性相关。参与方实例可以拥有有形(车辆)和无形(销售订单)对象。

虽然没有在这些联盟中明确定义,但顶级关系类包含在这种混合方法中,以从定义多对多关系的任何特定本体语言中抽象本体。

信息模型的类

信息模型作为一个知识领域,可以有自己的本体,可以对多层次本体进行建模。信息模型顶级对象类(ODEF 信息集)可用于包含定义信息模型的子类(图 20)。这些包括:

数据类型

测量单位

属性

词汇术语

角色

物联网

[图20|信息模型类层次结构。

数据类型的本体

数据类型和度量单位(如 QUDT.org)的本体可以在业务和技术中提供基本的语义互操作性。

数据类型类可以作为信息模型的子类进行建模。所有基于数字电子学的数据在最低级别上都表示为位(备选方案 0 和 1),数据类型类的 Bits 属性可由所有子类继承。Number 和 String 是原子数据类型(数据类型类的直接子类),因为它们的值不能用较小的部分来描述。整数和浮点“基元”可以定义为 Number 类的子类(与 schema.org 一样)。原子和原始数据类型已由标准组织定义(例如,ISO.org 11404,W3.org XML 模式),但它们之间的不一致很难管理。

具有唯一属性的其他数据类型(如 Quantity)可以从基元数据类型派生并定义为其子类。但是,在编程语言和联盟数据服务之间,特定基元和派生数据类型的使用各不相同,限制了语义互操作性(图 21)。

物联网

[图21|联盟数据类型]

术语的数据类型

Term 数据类型(类似于 Haystack 的“标记”)可由属性(类似于 Haystack 标记)用于单独或与对象类层次结构一起对对象进行分类。

与受控词汇一起使用时,Term 属性的值可以表示 Term 对象。例如,在图 19 中,根 Object 类的 Name 属性被分配给 Term 数据类型。根 Object 类的 Name 属性值与受控词汇表中的“Object”术语相关(图 16)。

Term 的概念也可以建模为信息模型的子类(图 20)。

关系的数据类型

关系数据类型(类似于 Haystack 的“Ref”)可以分配给属性,以表示与相同或不同类的对象的关系。例如,根 Object 类的 Class 属性被分配给“关系”数据类型(图 19)。Attribute 类的“在类内”属性也分配给关系数据类型(图 20)。在这种情况下,该关系表示 Class 对象中属性对象的包含。

分配给关系数据类型的属性应限制为单个类中的对象,该类应该是限制性最强的子类,以正确反映关系。

测量的数量数据类型

业务和技术依赖于测量的数字,其中大多数都有单位。数据类型本体可以将测量的数量(schema.org 定量值)数据类型定义为 Number 数据类型的子类。还可以为测量的每种类型或“维度”定义数据类型,作为 Quantity 数据类型的实例(对象)。例如,“温度”数据类型(图 21 中的 UN/CEFACT 温度测量类型)可以定义为“数量”子类的实例。

通过将货币(货币)金额建模为另一种测量类型,可以跨所有测量类型对流程(包括值转换)进行规范化。可以使用一种机制(类似于 xe.com)来检索与货币单位关联的换算系数(货币汇率)的动态值变化。

测量单位的类

使用最广泛的单位制是国际单位制或SI。ISO 80000-1 进一步定义了 SI 和国际数量体系 (ISQ) 的数量和单位。

单元类可以作为信息模型的子类进行建模。图 22 显示了数据集中每个对象继承的 Object 类的属性(标识符、名称、类)。该图还包括由对象的 Class 属性标识的类(Unit)的属性。

物联网

[图22|具有对象和单位属性的单位类的示例实例]

与数据集中的数量值配对的单位标识符(如 ºF)(如干草堆标记的数据)可以在标识的单位对象中解析为数量数据类型(如温度)。Unit 对象的属性还可以支持单位转换过程(图 23)。

物联网

[图23|使用具有转换属性的单位实例进行温度值转换]

对象的角色

角色的概念(例如在 O-DEF 中)描述了可由特定上下文中的对象执行的功能。角色类可以作为信息模型的子类进行建模,并且可以包含应用于不同对象类的实例(图 24)。

物联网

[图24|具有对象和角色属性的角色类的示例实例]

关系类中的实例可以将角色的实例分配给对象。一个对象可以有多个角色。例如,人员的实例可以具有“员工”、“家长”和“乘客”角色。某种类型的设备实例可以是传感器和通信器。许多设备的目的是承担相同的人员角色。因此,可以跨对象类分配角色。

某些角色(客户)具有相应的反向角色(供应商)。将客户角色分配给参与方(在 ARTS ODM 中建模)时,会将相应的供应商角色分配给另一方以形成贸易关系。

审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分