网路资讯/别把语意资料库跟关联式混为一谈

作/道格

语意科技协助企业整合资料

别以为语意资料库科技只能用在BBC Online消费者服务、或是Best Buy与思科追求的网路创意等。终端用户运算商品化过程,促成了各式各样的创新;而语意资料库科技也一样,它可以为许多企业带来好处。

整体而言,语意资料库(Semantic Database)有5 种主要好处:这些资料库可以与既有的相关资料库协同合作、它们可以相容于网路科技、其底层科技可以促成各种资料库的整合、其资料架构设计上具备弹性。所以,它们可以协助企业应付重大的资料难题

它们的最大卖点在于资料关系持续演化的。在1980年代,我们用住家电话办公室电话、以及寄信地址来找出人的关联。到了1990年代,我们还会拿出手机号码电子信箱帐号。现在,我们则透过各式各样的网站、以及社交网路帐号产生关联。

光是把这些识别码连结起来还不够,我们的系统能够了解使用这些资讯的正确情境。也就是说,资料本身必须具备能够让机器理解的意涵。所以语意式科技的大前提,就是资讯必须能够让机器判读。

资料在定义上必须提供意义背景脉络,让电脑自己就可以判读资讯,而不需要人来解读。这不仅是要提供一个类似XML schema的资料架构,还需要资料在本质上具有意义,让人类与机器都能判读。

描述资料意义的语意式科技标准称为「网路本体语言」(Web Ontology Language, OWL)。网路本体语言界定了一整套的资料关系描述,为商业词汇资料集、与资料属性建立一套定义,产生出来的结果,就叫做「本体」。

一般来说,一间公司会建立、使用多种本体。在企业层级,本体会界定营运部门、绩效、与其它核心商业概念。在系统层级,本体会界定其所管理的资料类型,以及该资料的明确属性、还有这些属性中内涵的架构与关系。

虽然是不同的本体,但它们之间环环相扣,系统层级的内容与企业层级的概念彼此相关。从系统的角度来看,本体代表着资料的意义与关连。本体不会建立表格或定义储存机制;它只会传达资料中可能存在的关联性

在关联式资料表中,表格中的直列会决定资料的储存,这是很重要的一项差异。其它来源的资料,例如关联式资料库、重要资料储存、以及表格等,都可以用来产生语意资料。事实上,语意式科技的核心特色就是,如果既有的关联式资料库架构已经够用,那么你就不必再重新装载资料。

天时与人和才能突显 语意式科技的优势

大部分公司都已经在关联式资料库科技上投入大量资源,包括管理软体、ETL工具、资料市集、资料仓储、以及各式各样的报告系统。所以语意式科技是否值得企业投资,建立新的基础架构、进行训练与资料库重构

如要判断自家企业是否应该考虑语意式科技,可以考量以下3种情境,在这些情境中语意式科技会是很大的利器

网路资讯.254.255期(新春号)