浅谈网页长期保存的策略与方法探讨 |
|
|
摘要:网页作为网络信息的重要表现形式,承载了海量的信息资源,有着非常大的价值。但是网页自身却非常容易变更或者消失,给网络信息资源的安全造成了威胁。有必要对网页进行长期保存,以保护网络信息资源。笔者通过对国内外众多网页长期保存项目的对比分析,提出了我国在网页长期保存上的策略以及评估、选择、收集、整理、存储和利用的方法,以期对我国的网页长期保存项目提供建设性意见。 关键词:网页;长期保存;策略;方法 中国论文联盟*编辑。 网络信息作为数字信息的一种,随着互联网技术的应用和发展而飞速地增长。网页对于网络信息而言,具有非常重要的作用。如何妥善地保存和维护这些网页,使这些含有海量信息的网页能够长久地存在,并能被人们获取利用,是摆在我们面前的一道难题。 1 网页长期保存的必要性 1.1 网页数量骤增 据中国互联网络信息中心(CNNIC)的统计,自2003年开始,中国的网页规模基本保持翻番增长,2009年网页数量达到336亿个,年增长率超过100%(见图1)。而Google在2008年宣称,其索引的网页数量已经突破1万亿,并且其数量还在以每天数以亿计的速度在增长,“互联网上的网页已经多得无法计算了”。大量网页的背后是海量的信息资源,它们不仅是人类知识的宝库,也是人类记忆的财富。我们有必要将其妥善保存。 br> 1.2 网页信息变化快 网页信息的变化体现在两个方面: 一是网页内容的变更,通常是管理员定期或不定期地更新网页,以便增加新信息或修改之前的信息。这并不会引起网页数量的变化,但是一定程度上更新了网页的信息,因此原网页的部分信息可以认为是丢失了。 二是网页的新增或删除,通常由网站管理者新增某些网页或者删除某些网页。一旦删除,该网页便从互联网上消失,其他用户无法再访问。网页的增删会引起网页数量的变动。 相关学者研究发现,在6个月内近50%的网页会发生变化,68%的网页1年内将被从网上移除。 而Wallace Koehler的观察结果更为显著,他发现98.3%的网页6个月内会发生变化,如观察时间为1年,则比例上升为99.1%。此外,有20.5%的网页6个月后不能再被访问到,1年后上升到[1] [2] [3] [4] [5] [6] [7] [8] 下一页 |
|
|
|
上一个论文: 浅论口述档案 下一个论文: 浅析我国濒危少数民族档案遗产保护 |
|