第37卷 第5期 计算机工程 20l 1年3月 1.37 NO.5 Computer Engineering March 2011 ・软件技术与数据库・ 文章编号:l00 _3428(2011)05—_005每 3 文献标识码:A 中图分类号:TP311 基于关系数据分析的知识服务模型 高雅田,李春生,富字 (大庆石油学院计算机与信息技术学院,黑龙江大庆l63318) 摘要:研究生产分析与关系模式相互转换的工程生产知识结构,包括领域元概念、工程事实、设计规则、生产活动的设计与规范化描述。 采用框架表示法表达元概念及事实,以服务的方式定义工程作业的常规方案。引入本体描述工程基本概念与关联,完成逻辑概念与关系模 式的映射。针对需要生产状态信息作为中间知识的事实进行工程生产一关系模式解读,给出油田开发知识服务设计。 关健词:知识服务;领域本体;框架知识 Knowledge Service Model Based 0n Relation Data Analysis GAO'Ca—tian,LI Chun-sheng,FU Yu (School of Computer and Information Technology,Daqing Petrol Institute,Daqing 1 633 1 8,China) [Abstract!The paper studies the knowledge structure of conversion between the production analysis and relational mode.It includes the standard description of the meta—concept,the fact of engineering,design rules,and production activities.The representation method of knowledge flame is used to represent production concept and fact,and the service is used tO represent the normal scheme of engineering.The domain ontology describes the basic concepts and relations among them,and defines the mapping relationship between logical concept and relational mode on the basis of above discussion.Considering the fact which considers production information as middle knowledge,it achieves conversion between the production fact and relational mode.It designs the knowledge structure for oilifeld development. [Key words]knowledge service;domain ontology;flame knowledge DOI:10.3969/j.issn.1 000 3428.201 1.05.0 1 9 l概述 工程生产数据大多在数据库系统中以关系的形式存储, 在知识经济时代,知识成为组织生存和发展的核心竞争 本身并不具备支持知识推理的能力。需要基于数据分析,提 力…,通过领域知识的定义与推理,基于信息化技术能够实 取生产论据并且结合业务知识获得符合应用的结果。 现生产规划与设计任务。__亡程设计过程往往需要通过生产数 2.1工程领域本体的引入 据解读得出的作业状态及满足一定条件的生产对象集合。因 知识服务支撑环境为工程生产智能应用系统提供领域知 此,辅助设计及决策必须结合生产情况的动态变化。本文研 识服务。在关系数据库中,一个关系包含若干元组,每个元 究基于关系数据分析的知识服务模型,在知识推理的基础上, 组都表示现实世界中的某个实体 J。就粒度而言,关系实体 融入工程数据所代表生产事实的解析。 或者其组合对应于生产对象,可以用概念描述。支撑环境需 2工程生产知识服务模型设计 要对知识作必要的区分,并且避免不必要的重复,知识元素 基于领域知识工程作业具有不同的辅助设计及决策需 设计能够支持对应于关系主体的推理活动。因此,采用领域 求,为了解决应用多样化并且达到信息共享的目标,设 元概念一工程事实一设计规则及活动的层次设计。通过显示的 计基于领域的工程生产知识服务模型,分离知识服务支撑环 定义及抽取关系数据模式所代表的实体信息,结合到知识推 境与应用系统,研究适用于领域范畴的知识服务提供平台。 理的恰当层次,完成生产论据与知识推理的融合。 在此基础上,设计并实现各类智能应用。支持关系数据解析 关系模式语义描述的表达涉及到生产概念的规范化。解 的工程生产知识服务模型如图1所示。 析数据库的关系模式信息,需要映射到领域生产对象,因此, 引入本体实现生产对象概念的结构化,并且规范领域内相关 应用 I 堑 : : 些 : 些 』 概念之问的关系。在此,领域知识本体可以使用一个二元组 雩鎏 进行定义: DO={ConSet,RelSet} 知识 箜 其中,ConSet表示概念集合,概念为具有相同语义范畴的生 服务 点撑 产对象集合的描述,设 o表示生产对象即生产概念的具体实 领 领域活动,设计规则 8 lI 环境 域 知 程事实:原 事实,复合事实I 例,po={x l X∈C and C∈ConSet};RelSet为关系集合,关 识 奉 领域元概念 l知识结构 l 系 描述生产对象之间的相互关联。在概念论域上的n维卡 体 基金项目:黑龙江省留学归困人员科学基金资助项目(LC06C09) 地壁:憋扼燮矍 蚕垡 信息 作者筒介:高雅 ̄1(1979--),女,博士研究生,主研方向:数据挖掘, 数据层l 生产数据管理 智能系统;李春生,教授、博=b、博上生导师;富宇,副教授 图1 支持关系数据解析的工程生产知识服务模型 收稿日期:2010—08—19 E・mail:gaoyatian1979@163.conl 第37卷第5期 高雅田,李春生,富宇:基于关系数据分析的知识服务模型 57 氏积定义为: CK={(po1,po2,・--,pon I po1∈CI,po2∈C2,‘一,pon∈Cn} 记作clxC2x…xCn。其中,C1,C2,…,Cn∈ConSet,n=l,2,…; 设R∈RelSet,R:{r 1 rcCK}。因此,当n=2时,R表示在概 念论域的二元关系。 知识本体确定该领域内共同认可的概念,并从不同层次 的形式化模式上给出这些概念间相互关系的明确定义。利用 知识本体作为关系数据模式与知识的中间模型将领域知识与 关系模式信息的映射细化到概念层次,从而在概念级完成关 系数据所反映生产状态的解读。 2.2知识结构设计 知识工程对知识表达进行了大量的研究。文献[3]基于语 义网技术提出了知识查询整合机制。文献[4】将知识资源的模 式统一映射到子本体上。大多数研究关注知识的重用与管理, 对于非过程的静态知识可以起到较好的处理效果,然而工程 生产规划需要根据生产数据推理作业状态,结合领域知识进 行决策。因此,针对知识的不同层次及特点,将框架法用于 结构性强的概念、事实表达及具有规范流程的设计规则表示 (文中给出关键槽设计),对于动态变化的设计规则及领域活 动的处理以服务的形式提供。 2.2.1领域元概念 元概念层与本体模型相连,基本概念的更新可以通过领 域本体的演化来实现。 定义1元概念为三元组DC={ConlD,LO,DESet) 其中,LO为逻辑对象,即工程生产涉及的具有自然语言特征 的实体;DESet为数据实体集合,元概念实现数据实体与语 义对象的相互理解,然而语义对象往往并非对应关系中单独 的元组,而需要多个相关元组一起才能完整地定义,只有这 些元组结合在一起对于分析需求来说才具有意义。 因此,把这些符合本体上定义关系R的相关元组集合与 相应的逻辑对象匹配。当集合元素数目为1时,该逻辑对象 对应于一元组。元概念采用框架表示法,具体如下: 框架名:<领域元概念> ID:整数 元概念描述:字符串 数据实体表达:表达式(<数据实体>运算表达式,NULL) 默认:NULL 框架名:<数据实体> ID:整数 实体描述:字符串 表名:字符串 字段名:字符串 类型:单位 当数据实体表达槽为NULL时,领域元概念表示一般的 领域术语。否则为逻辑语义及关系模式的概念级别的映射框 架。关系模式属性之间根据数据类型不同可以满足相应的运 算,元概念也可以进行符合数据实体类型的运算。元概念本 身可以是其他元概念的组合,在新的逻辑对象的定义中,只 需要为其命名,系统分配ID,指定组合的成员,运算在数据 实体级别进行。 元概念规范1关系模型具有可用的数据访问视图,数据 访问不考虑数据库连接链路,假设在视图访问基础上。 元概念规范2元概念定义及更新满足外部关联一致性, 即对于定义,设存在: YC=YC1xYC2x…xYCn,n=l,2,…,当且仅当YC1∈DC and yC2∈DC and YCn∈DC’。 对于删除更新,YC1,YC2,…,YCn允许删除操作,当且仅 当YC被删除。 2.2.2工程事实 工程事实定义了领域内作业辅助决策及措施设计过程中 依赖的证据及事实,由于工程分析大多具有时效性,因此加 入时问因素。从结构不同分为原子事实及复合事实。 定义2原子事实指在结构上不能分解出其他事实的知 识,由词项结合而成,至少包括主体词、关系词2个部分, 附加信息为可选项。其逻辑形式包含如下2类: (1)Predicate(a, ),a6DC:主体元概念a与附加信息b满 足Predicate二元关系。b可以是值、门限,或者生产对象, 当b为生产对象时,当且仅当bEDC。 (2)Attribute(a),aEDC:主体元概念a具有Attibute属性。 原子事实采用框架方法表示,设计如下: 框架名:<原子事实> ID:字符串 描述:字符串 主体:<领域元概念> 关系:可用算子(谓词关系,属性) 附加信息:实体(值,元概念等) 原子事实为工程事实表达的单位,在原子事实的基础上, 结合其他运算关系构成复合事实。 有些分析需要结合生产状态的变化,即工程作业的设计 或者决策过程中具有生产数据的操纵需求。因此,引入工程 生产一关系模式解析。 2,23 工程生产~关系模式解析事实 该类事实描述需要操纵关系数据库的知识。在知识服务 中,主要提供设计与决策支持,并非关注数据库操作。因此, 主要考虑生产状态及数据查询,对增加、删除、修改等数据 操作不予支持。 定义3工程生产一关系模式解析事实:在工程生产事实 表达基础上,含有关系模式描述信息的事实,至少包括生产 对象、主体词、关系词、限定词4个部分,限定词分为范围 限定词F(S,V)、时问限定词(Time)。附加信息为可选项,其 逻辑形式包含以下2类: (1)F(Execute(Object(a)--- ̄Predicate(b,c),Time(s,P)))),a∈DC, 并且b∈DC,表示针对在时间S至e范围内有效生产对象a 进行Execute操作,并且a的属性b需要满足附加信息C的 Predicate二元关系。其中,C可能是值类型、字符类型或者 元概念类型。 (2) 0bject(a)-+Attribute(b)),bEDC,生产对象a的属性 主体元概念b具有特征Attribute。 预定义的原子事实包括生产状态描述、知识推理机遇到 生产分析情况,通过事实一数据推理机解读关于生产的原子事 实,获得经由工程生产数据解读的结论。 工程生产一关系模式转换建立在SQL操作基础上,当知 识推理机提出数据操作请求时,事实一数据推理机分解相应事 实,映射到具体的生产数据,生成符合事实解析的SQL数据 操纵语句。 SQL语句的生成主要关注3个集合:操作对象0,操作 条件C,附加条件值 。事实描述了工程生产状态,原子事 实一数据转换需明确满足生产状态的工程对象,即0 /ect(a)。 有如下事例: 与上一月相比,产油上升的采出井。表示为: 58 计算机工程 2011年3月5日 框架名:<J2程生产+关系模式解析事实 > 描述:与上一月柑比,产油上升的采出井 生产对象:<采出井> 状态原子事实:<原子事实生产描述> 范围限定: 时问限定:Time(CurrDate,CurrDate一,) 框架名:c原子事实生产描述> 描述:产油l==升 主体:<产油> 关系:上升 通过事实解析,获得操作对象集合0={采出井};操作条 件c={产油上升};附加条件值A={NULL}。该框架描述可以 支持通过知识解析,生成相应的SQL语句,获得需要的生产 信息。 2.2.4设计规则及生产活动 设计规则定义了生产设计决策工作的基本问题解决方 案。生产活动描述了动态设计方案,框架描述设计规则各个 元素的操作逻辑,复杂并且难以用结构规范的设计元素被定 义为生产活动,以服务的形式提供给知识系统。 定义4设计规则指根据生产事实得出相应的结论及做 出一系列的行动。设 为一个没计规则,当且仅当ReERE, RE={PFS,RS}。 其中,尸耶为工程知识的集合,PFS={xlxEES或者 ∈尺E}, ES为工程事实集合;RE为设计规则集合。集合元素为Ⅳ, N>1;RS为事实之间的关系集合,包括And、Or、Part—of 等,框架槽之间的关系默认为And。 设计规则预定义推理槽Infer、前件槽IF、后件槽THEN、 取反槽ELSE等表达具有因果关系的设计。 生产活动表述了较为复杂的工程设计。生产活动定义为 三元组:DA={DAID,DADes,DAction}。其中,DAID为设计 活动的ID;DADes为生产活动描述;DAction表示具体设计。 生产活动以服务的形式提供给知识系统,流程如图2所 示。生产活动服务库所能提供的设计服务及服务所包含的辅 助决策行为以注册表(见表1)的方式公告于知识库,知识推理 机根据设计方案得出设计活动调度序列,通过访问服务注册 表获得提供设计的服务库地址。系统根据推理信息向生产活 动构件库请求相应设计支持。 工程生产一关系模式解析『知识推理 活动序列 生产活动调度 设计规则,生产活动 兰J———丁二塑 1_ 查』 动路由配置类 事实层 领域元概念层 脚 动执行单元 y活动执行单元 生产活动服务库 圈2生产活动服务解读过程 表1辅助行为注册表结构 3设计实例 研究油田开发方案设计知识结构,基于油田开发设计知 识服务支撑环境,建立各类决策应用系统。从业务划分,油 田开发涉及测井、钻井、录井、井下作业、采油工程等20多 个专业,初始概念20 000多个。通过总结经验丰富的工作人 员的开发知识,建立知识服务支撑环境,驱动各个辅助设计 应用系统的工作。 在本体概念模型建立的基础上,设计油田开发元概念与 数据的映射,生产数据模式来源于目前油田专业数据库A2 系统。元概念定义了主要的3 000个关系与概念映射模式。 油田开发决策事实在元概念基础上,描述了生产的各种 状态和效果,分解为生产对象与状态或者行为变化的集合。 事实语句表示为主语十谓语+宾语形式,即操作对象与附加信 息满足某种谓词关系。采用语句流分析机制,实现对事实语 义的推理和识别。语句分解为一系列动作(谓词)及对象(包括 元概念、值、模型),通过识别动作及对象的操作序列,分析 知识所表达的意图和内容。 油田生产事实的描述包括与具体数值的比较,例如油层 厚度大于x;也包括自身状态发生变化,例如产液量上升Y ̄/o。 因此,油田生产一关系模式事实类型从生产角度分为值类型、 波动类型及对象比较类型及模糊状态类型。不同类型的事实 匹配相应的关系谓词,设计了相应的推理机制,知识维护平 台提供了定义接口,用户可以在现有设计的基础上进行扩展。 表2给出了事实类型对应的谓词集合及附加信息的设计。 表2知识组成结构 设计规则包括措施优选、问题井检测、生产状态预警 3个主要类别。决策活动的定义主要包括压裂、补孔、堵水、 分层注水调整等措施设计活动。 基于知识服务驱动实现了生产预警、分区块措施选择建 议,辅助生成施工方案等决策支持应用系统。所开发系统已 经正常工作,并且取得了应用部门的较好评价。 4结束语 本文研究了工程领域辅助设计的知识服务提供方法。知 识结构的设计重点支持关系模式与生产事实的交互解析,针 对不同应用,需要进一步加入特征元素。领域内建立统一的 辅助设计知识服务,在此基础上构建决策应用系统可以节约 软件资源,充分地利用领域知识,缩短系统开发周期。 参考文献 【1】张德海,沙月林.基于本体与工作流的知识服务系统[JIl计算 机工程,2009,35(19):75—77,80. 【2】杨开英.数据库系统概论【M].武汉:武汉理工大学出版社,2003. [3]张成洪,马国强.供应链中基于语义网技术的知识共享整合系 统….系统工程理论与实践,2007,27(12):96—103. 【4] 毛郁欣,陈华钧,姜晓红.基于子本体的领域知识资源管理[J1. 计算机集成制造系统,2008,l4(7):1434—1440. 编辑顾逸斐