浅析WEB日志数据挖掘技术 |
|
|
式web日志挖掘技术来解决。代理这个概念源于分布式人工智能领域,随后引申到其它计算机研究领域。代理主要是指在一定环境下自主运行,包含信念、承诺、义务和意图等精神状态的实体。它具有自治性、社会性、反应性和能动性等特点。 多代理就是由多个代理组成,它们之间互相协作,相互作用,完成有些复杂任务或者目标。显然多代理解决问题的能力比单个代理要强。它的数据分布,计算过程是异步、并发或并行的。多代理分布技术用到web日志挖掘系统主要基于多代理技术的三重体系结构,包括用户访问层,代理层和web服务器层。用户层管理不同的用户有不同的操作权限,一般用户只允许查询结果,而管理用户则可以实现配置代理及监控系统情况的功能。web服务层就是web服务器群集组成的,每个web服务器提供了相应的web日志文件,并有一个接口实现与代理层的交互。代理层是用户访问层和web服务器层的桥梁,主要为了解决分布式异构性和速度问题以及保证数据的完整性而设。 代理技术的使用能够有效地对多个异构web服务器同时进行分析和处理。对于数据的预处理和数据挖掘算法等则和简单结构的web日志挖掘方案类似,这里就不再叙述了。 三、结论 由上面列举的两种环境下的web日志挖掘方案可知,好的数据预处理手段是web日志挖掘方案是否成功的关键。在做预处理的过程中,由于不同层次的访问者浏览网站行为的复杂性,不确定性和不连贯性,要完全准确地分析全部访问者的行为也是不切实际的,应该根据分析的需要,首先确定需要的行为,确定这些行为出现的一些条件和特征,从而确立一些分析规则,将这些行为尽量挖出来,对于不需要的行为数据应该尽量过滤。只有预处理数据做好了,后面的分析和挖掘才会比较准确的,因此,安排多些时间放在预处理数据阶段是十分必要的。 上一页 [1] [2]
|
|
上一个论文: 信息时代下加强高校学生档案管理之我见 下一个论文: Openprocess在热网监控系统中的应用
|
|
|
看了《浅析WEB日志数据挖掘技术》的网友还看了:
[法律论文]浅析涉外职务犯罪预防 [法律论文]浅析名人代言虚假广告的民事责任 [电子机械]浅析基于可靠性工程的电子信息装备质量管理研究 [免费范文]浅析从律师业务的拓展看公证 [免费范文]浅析实际持卡人不能构成恶意透支型信用卡诈骗罪 [法律论文]浅析非法取得死者财物与犯罪的界限 [法律论文]浅析电动自行车的法律监管论述 [法律论文]浅析醉酒人刑事责任之中外理论 [法律论文]浅析实际持卡人不能构成恶意透支型信用卡诈骗罪 [法律论文]浅析从律师业务的拓展看公证
|
|