基于网格的面向专业内容的Web信息检索体系结构
(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;
(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;
(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。
目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。
2.2 网格中间件的设计
图3所示的网格中间件的主要功能是
(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;
(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;
(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。
内部主要功能模块说明如下:
(1)接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。
(2)关系数据库及数据服务Agent: 关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。
(3)格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。
(4)XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。
(5)发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。
其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。
3、工作过程
要使本体系结构具有高协作性和互操作性,用户、网格中间件、集群系统以及其它Agent等实体之间的通信是整个系统运转的关键。由于XML为基于特定专业内容的表达提供了一种极好的手段,XML是一种元语言,其严格的定义和规则集使人和机器都能更容易的阅读文档,因此本文将XML集成到各部分的通信语言中,在用户发出的信息检索请求文档、网格中间件、集群系统之间的通信均利用XML定义,这样做增强了通信的语义信息和灵活性并可以在多种平台使用,并且基于XML的通信语言其通信内容的表达比其它方法更容易开发语法分析器。
具体的工作过程如下:
(1)请求、定位过程:由网格用户层向网格中间件发送用户的信息检索请求文档,描述网格接口参数、信息请求内容等,在接受Agent进行身份确认及权限确认后,经文档格式转换Agent模块、文档分析Agent模块、发送Agent模块处理后,定位于某些特定的集群系统服务器。
(2)应答、处理过程:集群系统服务器经验证、调用资源服务Agent对信息集成系统进行查询后,将查询结果信息传输给用户。
4、 结语
本文利用网格计算、集群系统、XML在数据组织、交换、共享方面的优势,对大量分散、异构的面向专业内容的信息资源提供了一种有效组织和管理方法;并通过网格中间件,实现了信息资源的数据格式转换与快速定位,提高了信息检索的效果。本文仅提出了一个体系结构设计,对更为复杂的实际问题的适用性,还有待进一步的完善和改进。
参考文献:
[1] 洪学海,许卓群,丁文魁. 网格计算技术及应用综述[J]. 计算机科学,2003,30(8):1-5.
[2] 孟小峰. Web数据管理研究综述[J]. 计算机研究与发展,2001,38(4):385-395.
[3] 叶修洪,陈根才. 基于XML的电子数据交换的研究和实现[J]. 计算机应用研究,2000,17(12):25-27.
Tags:
作者:佚名评论内容只代表网友观点,与本站立场无关!
评论摘要(共 0 条,得分 0 分,平均 0 分)
查看完整评论