于信息资源的增长速度。单个搜索引擎的数据库所收集的web页面大大不足,就是所有的搜索引擎所储存的数据也只占全球web页面的50%强。由于这方面的原因,搜索引擎的检全率会无可避免的被降低。
③ 搜索引擎的查准率不高 一是返回的信息过多,这是现有搜索引擎检索信息的普遍现象;二是返回重复的信息,搜索引擎的检索结果中还经常重复出现同一信息源的不同部分,甚至出现不同信息源的相同内容信息。
④ 查询方式有限 目前大多数搜索引擎的查询方法比较单一,一般只提供分类查询方式和关键词查询方式。这样,一方面检索时不能从文献的多个方面对检索提问进行限制,只能就某一关键词或概念进行笼统的检索;另一方面,由于查询结果完全依赖于用户所给出的关键词,而大多数用户对他们检索的领域或索引数据库的关键词不太了解,因此使最后的查询结果相关性很差,往往是输入一个检索式,得到一大堆网址,但其中大部分是冗余信息。
⑤ 检索对象的数据结构单一 由于现在大多数网站使用的是传统的关系数据库对信息进行组织和存储,因此其使用的搜索引擎也是基于关系数据库的,这种传统的关系数据库非常擅长处理结构化的数据,但其对于非结构化的数据的处理能力则很弱。
⑥ 交互性不够 当前的搜索引擎与用户的交互性不够,与用户间缺乏足够的协作,不了解用户的情况,不记录用户提交的查询任务,不能处理用户的反馈信息,因而不能与用户进行足够好的交互以提高检索效率。
3.2 多媒体信息检索的局限
到现在为止,虽然单独针对图像、视频、声音等媒体的检索技术已经出现,但还没有任何搜索引擎能够充分解决多媒体信息的检索,其主要表现在以下几个方面:
① 检索效果不够理想 目前,几乎所有的多媒体搜索引擎在多媒体信息的查准率方面都不能达到令人满意的程度,用户将在返回的几百个甚至上千个图像中筛选需要的那一幅。这是很费时和令人难以忍受的,而且有时你所用的搜索引擎根本检不出你想要的东西。归其原因,一方面是在于查询方式的单一,另一方面在于对图像的标引深度不够,这就要求完善图像检索和索引机制。
② 用户查询接口单一 理想的多媒体检索系统中,人是主动的,用户的查询接口能提供丰富的交互能力,且直观易用,使用户能够在主动交互过程中通过调整检索参数,表达对图像的语义感知,最终获取满意的结果。这就涉及到如何把用户的提问转换为可以执行检索的特征矢量、交互方式的设计,如何获取用户的内容感知等问题。目前的多媒体搜索引擎用户查询接口比较单一,大多只提供描述查询接口,即关键词提问框。
③ 图像特征信息的表示与检索不够完善 基于内容的图像检索,实质上就是进行图像特征相似度的比较,但目前这一技术还存在许多问题。
④ 信息的自动加工与人工标引不够 目前文本搜索引擎在这方面的发展正日趋完善,而多媒体搜索引擎的研究刚刚起步,尤其是图像信息的加工,图像不同于文本,文本自身就能说明要讲的内容,而图像内容却需要加入人的理解和描述,人工干预虽能提高查准率,但一方面能被人工标引的是极其有限的;另一方面由于人工标引劳动强度大而限制了检索的范围,如何对图像信息进行快速标引和准确分类是急待解决的主要问题。
另外,目前基于内容的检索技术多应用于对静态图像的检索,对动态图像的检索还没有多少行之有效的方法。但随着宽带网络的逐步实现,动态多媒体信息在网络中将会越来越多。
【参考文献】
1 张杰. 浅论网络信息检索. 江西图书馆学刊,2002年增刊.
2 董慧. 网络信息资源开发与利用. 武汉:武汉大学出版社,2001.
3 卢小宾. 信息检索. 北京:科学出版社,2003.
4 李勇先,郑文良. 人工智能在网络信息检索中的应用. 图书馆建设,2003(4),4:81~83.
5 焦玉英,符绍宏,何绍华. 信息检索. 武汉:武汉大学出版社,2001.
上一页 [1] [2]