| 网站首页 | 范文 | 演讲致词 | 汇报体会 | 总结报告 | 公文方案 | 领导讲话 | 党建工会 | 论文 | 文档 | 书信 | 
您现在的位置: 范文大全网 >> 公文方案 >> 公文写作 >> 正文 用户登录 新用户注册
2003年中国互联网络信息资源数量调查报告           
2003年中国互联网络信息资源数量调查报告
> 服务器拥有情况
网站的链接数
网站的员工数
网站成立时间


频道数
网站版本
网站的可访问性 网站地图等
安全性 防火墙、操作系统等
网站效果指标 信息发布 可用性度量
业务结合
网页 网页按内容形式分类比例 计算机搜索 包括图像、音频和视频
网页按性质分类比例 政府、企业、商业等
网页按地域分布比例 省域及七大区分布
网页长度 以字节数计算
网页的更新周期
网页编码状况 简、繁体中文、英文等
在线数据库 按性质分类比例 问卷调查 政府、企业、商业网站等
按地域分布比例 华北、华南等七大区分布
按内容分类比例 产品、科技信息数据库等
按形式分类比例 图形文字数据综合等
按使用情况分类比例 分自用和公用
公用下分免费和收费
收费下分收费方式
按服务方式分类比例 面向终端用户或中介
在线数据库更新状况 -
数据库容量 物理存储量(g)
是否同时具有其它载体
否、是(光盘、纸质等)

三、调查时间
调查时间:2003年12月-2004年2月;数据截至时间:2003年12月31日。
四、有关概念
1. 在本次调查中,中国互联网络信息资源定义为:中国互联网络上公开发布的网页和在线数据库的总和。
2. 中国互联网络是指所有域名注册单位属于中国大陆的网站总和。
3. 在线数据库是指以web为界面,提供公共检索的收费或免费的数据库。
4. 网站是指有独立域名的web站点,其中包括cn和通用顶级域名(gtld)下的web站点。此处的独立域名指的是每个域名最多只对应一个网站"www.+域名",如:对域名sina.com.cn来说,它只有一个网站www.sina.com.cn,并非它有news.sina.com.cn、mail.sina.com.cn……等多个网站。
5. 商业网站指业务主要在网上进行的电子商业网站,如新浪、搜狐、网易等网站;企业网站是相对于商业网站而言,指业务主要在网下进行的企业所建立的网站,如联想集团的网站www.lenovo.com.cn
6. 网页搜索是指对抽取的网站从其首页(www+域名)开始搜索,通过网页上的层层链接,抓取所有属于该网站的网页的特征及其文本内容。
7. 静态网页是指url中不含?和输入参数的网页,包括:*.htm、*.html、*.shtml、*.txt、*.xml等。
8. 动态网页是指url中含?或输入参数的网页,包括:asp,php,perl,cgi等在server方进行处理的网页。
9. 网页的编码形式:是根据网页本身的信息通过分析得到的,不是通过一篇网页在html中的声明来判断的。因为大量国内的英文网页在其html声明中都是简体中文。
10. 网页的内容形式:是通过文件后缀获得的。关于图像、音频、视频的文件后缀定义标准参考mime标准。
11. 网页的更新情况:网页的更新时间是指搜索到该网页的当日日期与该网页的最后更新日期之间的时间段。
五、调查方法
(一)数据获取方式和渠道
域名和网站的总量数据通过国内各国际域名注册商和cnnic联合获得。
网页的特征数据由百度公司利用搜索技术对全国网站进行搜索获得。搜索时通过url判断同一网页是否有多个链接指向,避免了对这类网页的重复计算,通过判断不同网站的ip地址和首页字节数是否相同,排除了不同域名指向同一网站的情况。
网站的特征数据及在线数据库的特征数据通过call center电话问卷调查的方式获得。
(二)调查问卷的抽样方法
1.总体界定
按照对中国互联网络信息资源的定义(中国互联网络上公开发布的网页、在线数据库的总和),同时考虑到未注册域名而提供服务的网站数量较少以及调查的难度,本次调查中所指的总体为:中国(不包括香港、澳门、台湾地区)所有已注册域名的网站,包括.com,.net,.org和.cn域名(含org.cn,gov.cn等)下的所有网站。
2.抽样框
关于抽样框,最直接的作法是选择抽样框为全国有域名的网站名录。由于保密性的原因,抽样过程需要委托各域名注册/代理商完成,从方便实施并提高数据精度的角度考虑选择抽样框为全国(不含港、澳、台)范围内的域名名录。
由于一个网站可能会有两个或两个以上域名,而有的域名没有建立网站。这样对于总体而言,就出现了"抽样框单位没有对应的抽样单位"、"抽样框单位和抽样单位不一一对应"等问题。对此,考虑采用排除、事后加权等方法来解决。
3.抽样方法
本次调查的抽样方法采用分层按比例抽样:考虑到各域名类别下网站特征的差别,首先按域名类别分层;之后在每个类别内采用定距抽样的方法来抽取样本,最后对调查结果进行事后加权处理以估计全国范围的估计量。下面分阶段叙述抽样方法:
第一阶段:将样本量分到各层
因为到目前(2003年11月)为止只有截止2003年6月30日的全国范围的域名数的情况;同时考虑到我们主要是利用各类别域名数之间的比例关系来确定样本量在各层的分配,而这种关系应该不会有较大的变化。因此本方案按照截止2003年6月30日的"各类别域名数占全国域名总数的比例"将样本总量分配到各域名类别。
第二阶段:将样本量分配到各域名注册/代理商
抽样过程由域名注册/代理商按照抽样办法(由中国互联网络信息中心提供)抽取指定数量的域名作为样本。样本按照各域名注册/代理商所注册拥有的域名数的比例进行分配。具体计算办法如

上一页  [1] [2] [3] [4] [5] [6] [7] [8] [9] [10]  ... 下一页  >> 

  • 上一个公文方案:

  • 下一个公文方案:


  • 看了《2003年中国互联网络信息资源数量调查报告》的网友还看了:
    [企划方案]2013年感染病防治取传染办理方案
    [企划方案]2013年高三全体学生高考决心书
    [企划方案]社区2013年七一指导方案
    [企划方案]2013年雷锋月活动方案
    [企划方案]2013年中小学文体节活动方案
    [企划方案]2013六一儿童节活动方案
    [计划方案]2013年学习部学期计划
    [计划方案]计生工作者2013年工作计划
    [计划方案]2013年酒店员工培训计划方案
    [计划方案]2013年优质护理工作计划

    公文写作
    普通公文方案推荐信样例(计算机专业)
    普通公文方案在局机关先进性教育活动转段动员
    普通公文方案保持共青团先进性教育心得体会
    普通公文方案公交“青年文明号”司机事迹材料
    普通公文方案“四查、四审视”思想汇报
    普通公文方案黄浦江源头水质调查报告
    普通公文方案农村土地征用补偿款纠纷引发的思
    普通公文方案乡镇侨务工作上半年工作总结及下
    普通公文方案中国企业管理为何身陷危机管理深
    普通公文方案市场调查报告--本土品牌主导中国
    普通公文方案关于街道开展城市管理工作的思考
    普通公文方案对我县社会保障工作情况的调查与
    公文方案
    普通公文方案[公文写作]大学生暑期农民生活状况
    普通公文方案[合同范本]居间合同(1)
    普通公文方案[申报材料]避孕药具半年度工作总结
    普通公文方案[公文写作]农业产业结构调整经验介
    普通公文方案[公文写作]农民工在市民化过程中的
    普通公文方案[公文写作]教育局长述职报告
    普通公文方案[公文写作]学校政教处工作总结
    普通公文方案[公文写作]岗位竟聘演讲稿
    范文大全
    普通范文[零八零六]烟草安保工作年终总结
    普通范文[范文大全]镇机关干部下基层大走访
    普通范文[范文大全]市物联网产业十二五发展
    普通范文[零八零一]2007年旅行社年终工作总
    普通范文[个人简历]简历模板:软件工程师
    普通范文[范文大全]关于进一步做好利用外资
    普通范文[范文大全]工商树榜样学先进争一流
    普通范文[检讨书]上课玩手机与欺骗老师的
    演讲致词
    普通演讲[开业开幕]市领导在建县60周年庆典暨
    普通演讲[开业开幕]在焦化公司砌筑开工典礼上
    普通演讲[开业开幕]乡联盟村林山种养殖专业合
    普通演讲[庆典致辞]妇代会献词
    普通演讲[竞聘演讲稿]税务稽查队副队长竞职演讲
    普通演讲[主持词]煤矿建矿50周年晚会串词
    工作范文
    普通公文方案[公文写作]自来水公司团员大会致辞
    普通公文方案[公文写作]市邮政局2007年局长工作汇
    普通汇报体会[征文演讲]物业公司职工演讲:用心谱写
    普通总结[自我鉴定]药学毕业生自我鉴定
    普通汇报体会[学习体会]开展群众观点大讨论学习心
    普通总结[工作汇报]街道“五好”村级组织争创
    普通公文方案[活动方案]全县相对后进村整顿转化工
    普通公文方案[公文写作]对湖南水落岱村饮水协会的
    普通总结[个人总结]学校公开课学习个人小结范
    普通公文方案[合同范本]泥画加工合同范本
    普通总结[述职报告]街道社区2009年度计划生育
    普通公文方案[常用公文]高中毕业生自我鉴定范文