本体 (资讯科学)查看源代码讨论查看历史
本体 |
---|
|
在计算机科学和信息科学中,本体是指对概念、数据和实体之间的类别、属性和关系的表示、命名和定义,这些概念、数据和实体构成了一个、大量或所有的论域。
介绍
本体提供的是特定领域之中那些存在着的对象类型或概念及其属性和相互关系[1];或者说,本体就是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机系统之中使用;或者说,本体实际上就是“对特定领域之中某套概念及其相互之间关系的形式化表达”。
本体是人们以自己兴趣领域的知识为素材,运用信息科学的本体论原理而编写出来的工件 (软件开发)。本体一般可以用来针对该领域的属性进行推理,亦可用于定义该领域(也就是对该领域进行建模)。此外,有时人们也会将本体称为本体论。
作为一种关于现实世界或其中某个组成部分的知识表达形式,本体目前的应用领域包括(但不仅限于):人工智能、语义网、软件工程、 生物医学信息学、图书馆学以及信息架构。
概述
英文术语“ontology”一词源于哲学领域,且一直以来存在着许多不同的用法。在计算机科学领域,其核心意思是指一种模型,用于描述由一套对象类型(概念或者说类)、属性以及关系类型所构成的世界。尽管不同的本体对于这些构成成分的确切称谓有所不同,但它们却都是一部本体不可或缺的基本要素。一般来说,人们所普遍期望的一点就是,本体之中模型的那些特征应当非常类似于相应的现实世界[2]。
就计算机科学与哲学来说,二者所说的本体之间的共同之处就在于,它们都是依据某种类别体系,来表达实体、概念、事件及其属性和相互关系。在这两个领域当中,存在针对本体相对性的种种问题(比如,哲学领域的奎因和克里普克,计算机科学领域的约翰•索瓦和尼古拉•高利诺|Nicola Guarino|高利诺}}),人们已经和正在开展相当大量的工作[3];而且,人们也在讨论关于规范化本体是否具有生命活力(比如,哲学领域之中针对基础主义(foundationalism)的讨论,人工智能领域之中针对Cyc项目的讨论)。二者之间的那些差别在很大程度上只是侧重点的问题。与计算机科学领域的研究人员相比,哲学家们则较少关心建立固定不变的受控词表。
然而,计算机科学家们则较少参与有关首要原则的讨论(比如,关于是否存在诸如不变本质之类事物的讨论,或者关于实体在本体论上必定比过程更为基本的讨论)。
历史
从历史上来看,本体源自哲学之中称为“形而上学”的分支。形而上学所关注的是现实的本质,也就是存在的本质。作为哲学的一个基本分支,形而上学关注的是分析存在的各种类型或模式,且往往尤其关注共相与殊相之间的关系、本征性质与非本征性质之间的关系以及本质与存在之间的关系。本体论探索活动的传统目标尤其是,为了揭示那些基本的类别或者说种类,而在关键之处将现实世界划分为对象的自然类别[4]。
二十世纪下半叶,哲学家们就如何构建本体的可行方法或途径展开过广泛的讨论,但实际上他们自己却并没有真正“构建”出任何非常精细详尽的本体。与此相比,计算机科学家们当时则正在构建着一些大型而又稳健的本体(如WordNet和Cyc),但相对来说却很少针对“如何”构建本体而进行辩论。
自二十世纪70年代中期以来,人工智能(简称AI)领域的研究人员认识到,知识的获取乃是构建强大AI系统的关键所在。AI研究人员认为,他们可以把新的本体创建成为计算模型,从而成就特定类型的自动推理。二十世纪80年代,AI领域就开始采用术语ontology来同时指称关于模型化世界的一种理论以及知识系统的一种组件。借助于来自哲学本体论的灵感,一些研究人员继而把计算机本体论视为一种应用哲学[5]。
二十世纪90年代初期,汤姆•格鲁伯发表了一篇后来得到广泛引用的网页和论文《迈向知识共享型本体的设计原则》。之所以该论文获得人们如此的青睐,那要归功于其中格鲁伯对于计算机科学术语“ontology”的审慎定义。格鲁伯采用这条术语来指一种对于某一概念体系(概念表达或概念化过程)的详细说明。也就是说,就像关于特定程序的形式化规格说明(形式化规约)那样,本体就是对那些可能相对于某一智能体(agent)或智能体群体而存在的概念和关系的一种描述。这项定义与“ontology”作为“概念定义之集合”的用法是一致的,但相对来说要显得更为通用。不过,这个单词在此的含义却有别于哲学领域对它的用法。
本体往往等同于那些由各种类、类之定义以及归类关系所构成的分类法层次结构,但本体并不一定仅限于此类形式。同时,本体也并不局限于保守型的定义(也就是传统逻辑学意义上的那些定义,它们所引入和采用的仅仅是术语,而没有添加任何有关现实世界的知识)[6]。要明确而又详细地说明所要表达的某个概念之时,我们需要声明若干的公理,从而对所定义术语的那些可能解释加以约束和限制。
在二十一世纪伊始的头几年,认知科学的跨学科项目一直在将这两个领域的学者群体拉得更近。例如,有人谈到“哲学领域当中的计算机化转变”。在这种转变当中,包括哲学家们分析计算机科学领域所编制的形式化本体(有时甚至还在工作中直接运用计算机软件),而与此同时,计算机科学领域的研究人员也在越来越多地引用那些致力于本体论的哲学家们的研究工作(有时甚至还是后者方法的直接结果)。不过,在这两个领域当中,依然有许多学者并未顺从认知科学的这种发展趋势,并且仍继续相互独立地开展着自己的工作,分别从事着各自的所关心的事情。
参考文献
- ↑ Fredrik Arvidsson and Annika Flycht-Eriksson. Ontologies I Retrieved 26 Nov 2008.
- ↑ Lars Marius Garshol (2004). Metadata? Thesauri? Taxonomies? Topic Maps! Making sense of it all on www.ontopia.net. Retrieved 13 October 2008.
- ↑ (Top-level ontological categories. By: Sowa, John F. In International Journal of Human-Computer Studies, v. 43 (November/December 1995) p. 669-85.),
- ↑ Perakath C. Benjamin et al. (1994). IDEF5 Method Report Knowledge Based Systems, Inc.
- ↑ Tom Gruber (2008). "Ontology" . To appear in the Encyclopedia of Database Systems, Ling Liu and M. Tamer Özsu (Eds.), Springer-Verlag, 2008.
- ↑ Enderton, H. B. (1972). A Mathematical Introduction to Logic. San Diego, CA: Academic Press.