摘要:为实现企业异构数据库间信息的共享和集成,对数据集成的原理以及主要技术进行了研究。重点分析了xml与关系数据库之间的映射,提出了一种以xml作为中间件的异构数据库集成和转化方案,并对其中的主要环节给出了具体实现。该方案实现了异构数据库的透明访问和联合查询,为企业信息系统集成提供了一种技术方法。
关键词:异构数据库;xml;中间件;企业;信息集成技术
人类在21世纪的可持续发展从战略意义上看,将会越来越依赖于社会的整体科技创新能力和由此派生而出的知识经济,而以信息技术为特征的全球网络化及internet的逐渐普及的影响也毫无例外地冲击着产品制造工业。所以,建立一套适合我国国情,支持产品开发与生产全过程的现代设计方法与系统,有效地组织多学科的产品开发队伍,充分利用各种计算机辅助工具,综合应用现代先进的设计方法,有效地考虑产品开发与生产的全过程,从而缩短产品开发周期,降低成本,提高质量,快速响应用户需求,这导致了:
从制造产品所需的企业管理与组织结构方面看,具备全球化、并行化与敏捷化特征的企业集成技术将成为新一代企业生存的决定性因素。
本文针对现代企业信息化的需求,提出了建立基于xml的企业信息集成框架的基本思路,阐述了xml技术在现代企业信息交互中的作用,并对xml与指定格式文本的转化方法进行了研究。
1体系结构
在大型企业中,由于生产自动化进程的阶段性,一般都存在基于多种数据库管理系统(dbms)的应用程序系统,如基于microsoft access的底层生产过程控制系统、基于oracle或者sql server的高层企业资源计划系统(erp)等等,这些系统的数据库一般都只在本系统内部存取,而不能被其他系统访问。LOcAlhoSt这种状况导致企业不同层次信息孤岛的出现,严重影响信息传递的实时性、加大信息维护的成本。
xml企业信息集成系统构建在数据库系统之上,目的是集成异构数据源信息,为数据共享、发布和应用提供支持,并负责xml向其他格式文本的转换。
本系统采用客户/服务器三层架构,如图1所示。各个异构数据库资源构成了系统数据层;本系统完成的主要任务,即异构数据集成和查询的功能被封装构成业务层,并使用xsl将xml转换成指定格式的文本;用户的应用构成系统的表示层。
2异构数据源集成方法
对于异构数据库集成,目前主要研究和采用的技术有以下三种:
2.1 数据库迁移和转换
将原有的数据迁移到新的数据管理系统中来,为了集成不同类型的数据,必须将一些非传统的数据类型转化成新的数据类型。利用数据转化程序,对数据格式进行转换,从而能被其它的dbms接收。这种方法处理简单经济,运行时效率高,已为大多数用户理解和接受。它适合于对数据的实时性要求不高的场合。
2.2 多数据库系统
它是一种能够接受和容纳多个异构数据库的系统,对外呈现出一种集成结构,而对内又允许各个异构数据库的“自治性”。多数据库系统一般分为两类:
有全局统一模式的多数据库系统,每个参与集成的数据库有自己的局部概念模式,用户可以通过建立在局部概念模式上的局部外模式访问本地库。在所有局部概念模式的基础上建立了全局概念模式,用户通过建立在全局概念模式上的全局外模式访问集成系统中的其他数据库。
联邦式数据库系统,各个异构的局部数据库之间仅存在着松散的联邦式耦合关系,没有全局统一模式,各局部数据库通过定义输入、输出模式进行彼此之间的数据访问。各局部数据库能对自己的完整性和安全性等进行控制。
2.3 xml中间件技术
目前,网上有很多信息格式是半结构化或非结构化的,其来源极端异构。利用xml作为中间件对这些信息进行元数据搜索,提供一个统一界面的检索系统是一个较好的应用方案。xml(extensible markup language,可扩展标记语言)是由w3c(world wide web consortium)组织于1998年2月制定的一种通用语言规范,它是专门为web应用程序而设计的sgml的简化子集。xml的好处是数据的可交换性(portable),同时在数据应用方面还具有如下优点:(1)xml文件为纯文本文件,不受操作系统、软件平台的限制;(2)xml具有基于schema自描述语义的功能,容易描述数据的语义,这种描述能为计算机理解和自动处理;(3)xml不仅可以描述结构化数据,还可有效描述半结构化,甚至非结构化数据。
中间件(middleware)是位于异构数据库系统(数据层)和应用程序(应用层)之间,向下协调各数据库系统,向上为访问集成数据的应用提供统一数据模式和数据访问的通用接口,是异构系统集成所需的粘接剂。功能完善的数据库中间件,可以对用户屏蔽数据的分布地点、dbms平台、sql方言/扩展、特殊本地api等差异。解决了异构数据库的互操作性问题。与第一种方法相比,它也解决了同步问题,而且利用中间件集成异构数据库,并不需要改变原始数据的存储和管理方式。各数据库的应用仍然完成他们的任务,中间件系统则主要集中为异构数据源提供一个高层次检索服务。显然,中间件系统模式是实现异构数据集成较理想的解决方案。
3异构数据库的中间件的设计方法
本文设计了三层的结构,分别实现与源数据库、中间数据库(xml文档)、目的数据库的连接,并实现数据在这三个数据源中的转换及传输,同时屏蔽掉各层次的异构特性,只需要通过简便的操作就能进行数据
[1] [2] 下一页