公共物品主要由国家投资和管理那样。重要的搜索引擎网站也应当按公共物品来建设,公益性必须放在第一位。就像大型图书馆的目录索引,就像一本大型权威字典的排序方法比如汉字的拼音排序法、笔画排序法等,本身不应有“倾向性”,商业利益不应当在其中呼风唤雨。搜索引擎的特性就决定了它本身的公益性越强,其功能就越能发挥得淋漓尽致。事实上,从2002年开始,美国、欧盟各国和日、韩等国纷纷以行业规范和法规等形式,力图实现搜索引擎的公正和客观,并形成行业标准。既然如此,权威的搜索引擎是否考虑由有经济实力和重要影响力的国家来建设和运营,也许它仍然不能彻底摆脱对政治和经济势力的依赖,政治和经济势力还会影响它的运作,但毕竟比商业公司能更多地摆脱商业利益的诱惑。我们这样说并不意味着当前由商业公司运营的搜索引擎没有公益成分。至少,国家级的公益性权威搜索引擎与商业公司所办的搜索引擎并行会更有利于互联网的健康、高效发展。所有的搜索引擎(包括商业网站的搜索引擎)都应当把公益性放在最重要的位置上。
纵观历史,我们不难发现,越是重要的公共事业或公共物品,国家就越有必要参与其中,这在任何制度的国家中都是如此。信息高速公路计划被许多国家视为战略性工程,投入巨资来建设。也许搜索引擎在互联网中的枢纽地位还未被人们充分认识,世界上那些有重要影响力的国家还没有表现出对它应有的热情和重视,目前还是商业公司在其中起着主导作用。但我们不能想象国家对具有战略地位的交通枢纽缺乏建构和控制能力,而搜索引擎在互联网世界中就处于交通枢纽地位。中国互联网协会互联网违法和不良信息举报中心在2009年6月18日发布消息说,根据公众举报并经核查,“谷歌中国”网站(google,on)大量传播淫秽色情和低俗信息,严重违反国家有关法律法规,违背社会公德,损害公众利益。这也从一个侧面暴露出国家还没有构建出足以与谷歌抗衡甚至压过它的搜索引擎,因而在涉及网上搜索问题时处于被动地位。
有些内容在网上靠搜索引擎搜不到,网络资源中还没有储备它们是一个重要原因。这一方面是由于投入不够,许多重要文化资源还没有实现数字化而成为公共资源,另一方面是由于许多重要资源被商业网站控制,不缴费不能使用它。搜索引擎的数据库所收录的信息资源是检索之本,数据库的规模和质量以及更新周期是评价搜索引擎优劣的主要参数之一。把搜索引擎作为公共物品来建设,自然也包括网上资源的公益化。国家应该像建设公共图书馆那样来建设网上公共资源,显然,目前国家对它的重视程度和投入力度还远远不够。可以考虑把当下正在进行的数字化图书馆建设与网上资源库公益化结合起来。网络资源最大限度地共享和最大限度地扩大公益性网络资源,应当是网络建设的重要目标之一;它也是搜索引擎成为公共物品的重要前提条件。
由于冗余度高,用户不得不把宝贵的时间更多地花在费力地筛选大量的不相关的搜索结果,来得到他们真正需要的信息上面。搜索引擎一般只能够查找出含有关键词的记录,但并不能判断该条记录的主题与关键词以及使用者需要的内容的相关性到底有多大。而且,同样的检索在不同的搜索引擎中会得到不同的检索结果。
有关部门应从信息的采集、软件设计开发等方面加以规范和协调,建立完整有效的信息索引机制。“这种标准化的信息索引机制的建立必须以一个通用的、合理的、规范的网络信息资源著录规则为基础。如果每个电子文档有一个编目款目或其等价物,那么检索接口就能提供一次内容信息(自由检索模式)和加工、过滤过的信息(图书馆模式)的检索。”面对因特网上海量的信息资源,我们应当用现代网络技术+“图书馆员的思维方式”进行管理。元数据(metadata)正是这种理念的体现。它是网络信息的著录规则,为网络资源的描述提供著录项,为检准率的提高起到相当重要的作用。在把搜索引擎作为公共物品建设的过程中,可以也应当向传统的图书馆学借鉴经验和理论。
搜索引擎快速、精确而有效地为人们提供相关的信息,提高检全率、检准率,应是它发展的方向。在分类中实现全文搜索(full text search)是努力目标之一。我们期待国家级权威的公益性搜索引擎和商业网站运营搜索引擎并存。大百科全书式的搜索引擎和专业搜索引擎相结合,最大程度满足人们搜索需求那样一种繁荣局面的出现。“一网打尽”,“一词搜尽”,“一键搜准”是我们对互联网和搜索引擎的期待
上一页 [1] [2]