| 网站首页 | 范文 | 演讲致词 | 汇报体会 | 总结报告 | 公文方案 | 领导讲话 | 党建工会 | 论文 | 文档 | 书信 | 
您现在的位置: 范文大全网 >> 论文 >> 计算机论文 >> 正文 用户登录 新用户注册
网络信息检索及其局限性           
网络信息检索及其局限性

【关键词】 网络信息 信息检索 搜索引擎

1 网络信息检索简介

随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。

1.1 信息检索概念

信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于internet信息空间中各种类型的网络信息资源。

1.2 网络信息检索的原理

网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。

① 布尔逻辑模型 这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。LocaLHOSt标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。

② 模糊逻辑模型 它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。

③ 概率模型 它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。

2 搜索引擎

搜索引擎是目前使用最为频繁的一种网络信息检索工具。与其他工具相比,它的检全率和检准率都比较高,具有很强的使用价值和广泛的应用前景。

2.1 搜索引擎的工作原理

作为一种www站点资源和其它网络资源进行组织和检索的检索工具,搜索引擎的检索机制一般包括数据采集和标引机制、数据组织机制和用户检索机制,基本构成如图1所示。

① 数据采集标引机制按照一定规律和方式对网络上www站点进行搜索,并将搜索到的www页面信息存入搜索引擎的临时数据库中。

② 数据组织据组织机制的主要功能是对www页面信息进行整理以形成规范的页面索引,并建立相应的索引数据库。

③ 索引数据库是用户进行检索的基础,它的数据质量直接影响到检索效果,而搜索引擎的数据采集标和标引机制又是决定数据库质量的关键技术。

④ 用户检索机制帮助用户以一定方式检索引擎的索引数据库,以获得符合用户需要的www站点或页面。

2.2 搜索引擎的分类

按照用户查找的途径划分,可将搜索引擎分为如下几种:

① 基于关键词的搜索引擎 主要通过使用自动采集软件来对网络上的数据进行采集标引,建立成索引数据库。它主要采用自动搜索和标引方式来建立和维护其索引数据库,供用户查询使用。

② 基于分类目录的搜索引擎 一般依赖于按照某种分类标准进行人工编排的分类体系。

③ 联合式搜索引擎 是基于关键词的搜索引擎的另外一种表现形式,是后者与基于类目的搜索引擎的一种结合。

2.3 搜索引擎的功能

目前internet上的搜索引擎种类繁多,虽然各种搜索引擎都有自己的不同信息采集标引机制,在其他一些方面各具特色,但其基本功能却是相似的。

① 布尔逻辑检索 这一功能使得用户能使用and、or和not来进行关键词的搭配检索。

② 模糊检索 在用户进行检索的过程中,系统会对跟用户提供的关键词相似的词语进行检索,并返回包含关键词或是这些相似词的检索结果。

③ 截词检索 这种检索形式利用检索词的某一部分来进行检索。在搜索引擎中,用户提供包含“?”或是“*”通配符的检索项来进行检索。

④ 限定词检索 这种检索加减号检索,它用来规定检索项中必须出现或是必须不出现某些关键词。

3 网络信息检索的局限

用户在查找网络信息资源时,不可避免的用到网络信息检索工具。检索工具的优劣很大程度的影响了用户的检索效率。虽然网络信息检索工具在最近几年有了长足的发展,但是到现在网络信息检索仍然存在着这样或是那样的局限。

3.1 文本信息检索的局限

① 网络信息标引的准确度不够 检索工具对网络信息资源的标引一般都存在着栅引准确度不够的问题,检索工具经常会在返回大量垃圾信息的同时丢失有用信息。当用户要进行特定的文献检索时,有时还会发现现存的检索工具无济于事,检索出来的数据完全被无用信息所覆盖。如想要通过搜索引擎查询清朝雍正年间李卫任浙江巡抚的资料,你只能够查到大量《李卫当官》之类无用信息。

② 搜索引擎的查全率不高 由于互联网上的信息资源以爆炸性的速度不断增长,搜索引擎采集数据的速度远远落后

[1] [2] 下一页

  • 上一个论文:

  • 下一个论文:


  • 看了《网络信息检索及其局限性》的网友还看了:
    [法律论文]浅论网络购物中消费者权益的法律保障
    [电子机械]浅析基于可靠性工程的电子信息装备质量管理研究
    [电子机械]浅谈中小企业电子信息安全技术研究
    [法律论文]试析个人信息的民法保护
    [法律论文]试论网络裸聊行为之刑法分析
    [法律论文]试论网络购物中不正当竞争的法律规制
    [法律论文]试析我国公民个人信息的刑法保护
    [法律论文]简论手机信息证据的审查判断研究
    [法律论文]浅谈网络环境下广播组织权利内容的扩张
    [法律论文]浅谈网络开放平台用户隐私权法律保护的宪政思考

    计算机论文
    普通论文试论网络文化对青少年成长的影响
    普通论文关于修船企业ERP系统的设计思想
    普通论文口碑信息结构对网络口碑传播信任
    普通论文基于Web2.0的网络口碑营销应用模
    普通论文对新信息环境下信息组织的解读
    普通论文论高校团学办公自动化系统
    普通论文基于Delphi开发平台的分布
    普通论文煤矿无人工作面中视频监控系统的
    普通论文试析高职院校校园网组建与应用
    普通论文关于网络游戏消费动机的分析
    普通论文试论网络学习社区的建构与组织策
    普通论文也谈高等院校非计算机专业的计算
    论文
    普通论文[免费范文]在春节期间集团高管例会
    普通论文[今日更新]校园恋曲
    普通论文[今日更新]《文化军事战略》:冷博
    普通论文[免费范文]领导者是怎样炼成的?
    普通论文[免费范文]大三暑期实习报告
    普通论文[免费范文]初论我国刑事诉讼中设立
    普通论文[今日更新]计算机软件专业人才培养
    普通论文[免费范文]试析监狱中罪犯权利的救
    范文大全
    普通范文[范文大全]建立保持党员先进体系工
    普通范文[范文大全]审计系统演讲稿:我的审
    普通范文[范文大全]XX学校2010年元旦文艺晚
    普通范文[科学发展观]水利计财科科学发展观心
    普通范文[范文大全]2009年单位内部治安保卫
    普通范文[调查报告]社区发展党员工作情况的
    普通范文[范文大全]关于开展2010年妇女发展
    普通范文[规章制度]社区治安义务巡逻队管理
    演讲致词
    普通演讲[会议发言稿]强化企业文化建设   促进业
    普通演讲[征文演讲]2011年5.12护士节演讲稿
    普通演讲[主持词]街道迎新春座谈会主持人串
    普通演讲[学生演讲稿范文]我与礼仪有个约会
    普通演讲[活动致辞]企业领导在新春佳节晚会上
    普通演讲[生日祝福范文]赠出国留学生赠言-美好祝愿
    工作范文
    普通公文方案[公文写作]述职报告(园林绿化)
    普通公文方案[企划方案]少数民族乡就业援助工作方
    普通领导讲话[反腐倡廉]在中共##市纪委第四次全会
    普通公文方案[公文写作]环境整治重点工作总结(建
    普通党建工会[政府政务]在全县质量工作会议上的讲
    普通总结[个人总结]晋升副主任护师业务总结
    普通公文方案[公文写作]加强林业科技推广 加快林业
    普通党建工会[政府政务]在全区发展民营经济工作暨
    普通公文方案[合同范本]补偿贸易合同
    普通党建工会[记要]“国际大学生节”策划书
    普通总结[工作汇报]人事和劳动社会保障局劳动
    普通总结[调研报告]渔业行政执法中存在的问题