| 网站首页 | 范文 | 演讲致词 | 汇报体会 | 总结报告 | 公文方案 | 领导讲话 | 党建工会 | 论文 | 文档 | 书信 | 
您现在的位置: 范文大全网 >> 论文 >> 计算机论文 >> 正文 用户登录 新用户注册
基于构造超平面的两阶段决策树算法的研究           
基于构造超平面的两阶段决策树算法的研究

摘要:如何在测试节点里构造一个恰当的分割超平面是构造决策树的关键,与单变量决策树不同,多变量(倾斜)决策树可以找到与特征轴不垂直的超平面。本文将从几何学角度说明构造测试节点的过程,提出了一种两阶段决策树的算法。
abstract: how to construct an appropriate partitioning hyperplane in test node is the key to construct a decision tree. different from decision tree with a single variable, the multi-variable (tilted) decision tree can find a hyperplane which is not perpendicular to the characteristic shaft. this paper will explain the process of constructing the test node and propose a two-stage decision tree algorithm.
关键词:超平面;两阶段;决策树

0引言
决策树有着许多不同的应用,其中包括诊断学里面的长度衰退[1]、分等级的多级标签的分类[2]等。在机器学习和数据采集方面,决策树已经成为一种最广泛的模型。一些决策树分类器的算法,比如id3[3],c4.5[4],cart等,经常被作为评价其他分类器性能的基准。locAlHoST它之所以流行,是因为其形式简单、判断迅速、解释容易和精确度高。
1两阶段决策树算法
1.1 两阶段构造超平面构造多变量决策树的中心问题是,在每个测试节点内对于连续的属性如何研究分割超平面函数如式(1):w1x1+w2x2+…+wnxn+threshold(阈值)=0,这里的x=(x1,x2…xn,1)是一个图形向量,它是由一个常数和n个描叙实例的特征组成的。wt=(w1,w2,…,wn,wn+1)是一个x的参数向量,也可以称为权向量(本文中假设wt是一个单位向量)。为了研究在每个测试决策树节点内构造超平面的过程,首先调整方程式(2):1w1x1+w2x2+…+wnxn=threshold,权向量wt=(w1,w2…wn)可以看作是用函数2构造的超平面的法线方向,然后我们可以将寻找超平面函数2的过程分为两个步骤:首先找出标准向量wt,然后再找出参数阈值。使wt中至少有一个参数不等于0,得到的超平面就会向特征轴倾斜;使wt中只有一个参数不为0,例如wt=(0,0,…,wi,…,0),得到的超平面就会与特征轴垂直。显然,如果在每个超平面的wt中只有一个参数不为0,构造的决策树将会退化为单变量树。为了深入研究这个问题,首先我们作了一个定义1。
定义1设v=(v1,v2…vn)(单位向量)是实例空间p内的一个方向向量,a=(a1,a2…an)是实例空间p内的一点。?坌a,如果a′=∑1?燮i?燮naivi,我们就说a′是a的v成分。
根据定义1可知,如把v当作标准轴,那么a′就是v轴上的值。
命题1设h是用函数(2)构造的分割超平面,假设a和h的交点的标准成分是v,那么v=threshold(阈值)。
证明设a=(a1,a2,…,an)是实例空间内的一点,?坌a∈p,a的标准成分b=∑1?燮i?燮nwiai。设a′=(a,a,…,a)是从a到标准轴的映射点,得到式(3):b=∑1?燮i?燮nwiai=∑1?燮i?燮nwia。
设t=(t1,t2,…,tn)是a和实例空间p的交点,因为wt是实例空间p内的标准向量,所以t=a′。联合(3)式,可以得到:b=∑1?燮i?燮nwia=∑1?燮i?燮nwiti=v。根据方程式(2),得到v=threshold(阈值)。
在权重向量wt内,如果只有一个参数不是0,例如wt=(0,0,…,wi,…,0),那么命题1中法线方向是准确的一个实例空间特征。因此,单变量决策树满足命题1。从这个角度来看,我们的框架是单变量决策树的延伸。此外,一旦发现有法线方向,就可以简单地解决超平面阈值:计算每个实例的标准成分作为一维空间值,然后根据一些标准(如基尼),寻找作为函数(2)阈值的最佳分割阈值。
1.2 两阶段决策树算法通过在1.1内的分析,寻找超平面函数的过程可以划分为两个阶段。基于这个,介绍两阶段决策树算法,这种算法通过两个阶段为每个测试节点构造超平面,如图1。除了步骤2和3,此算法和其他决策树算法没有什么区别。步骤2(第一阶段),候选超平面的标准列表是用某种研究函数构造的。许多著名的方法可直接用在这里寻找法线方向,如主成分分析,合作联盟等。步骤3(第二阶段)分为两个阶段:在第一阶段中,每个候选超平面阈值是基于一些纯判断标准(如信息增益率和基尼)。在寻找连续属性分割点方面,这个阶段类似于单变量决策树算法。在第二阶段,此模型根据判断标准从候选列表中选出最佳分割超平面。

在图2中给出了构造两阶段决策树的控制算法。许多算法只能处理一组特定的数据。为了简化问题分析的复杂性,步骤1对输入数据集进行预处理。预处理数据集之后,步骤2构造一个使用算法1的构造决策树树(参见图1)。一旦决策树被构造,它就会被修剪回来。在修剪阶段有两项措施用以评估每个测试节点:如果它是叶指数,则在测试节点下对一些子树指标(如错误率)和测试节点进行评估。如果是前者且后者满足一些条件(如后者的错误率小于前者),则其根是节点的整个树,由叶取代。不同的算法,采用不同的修剪指标。quinlan使用错误率评估基于统计界的评估[4],breiman等人使用成本复杂性评估基于错误率和树的规模(由叶节点数量来衡量)

[1] [2] 下一页

  • 上一个论文:

  • 下一个论文:


  • 看了《基于构造超平面的两阶段决策树算法的研究》的网友还看了:
    [电子机械]浅析基于可靠性工程的电子信息装备质量管理研究
    [免费范文]基于“服务为王”理念的微博湿营销模式构建
    [免费范文]基于虚拟现实技术的多维信息空间探析
    [免费范文]基于SEO技术提高网站访问量的策略研究
    [免费范文]基于ASP.NET的企业进销存管理信息系统的设计与实
    [免费范文]基于禁忌搜索方法的集装箱配载问题研究
    [免费范文]基于条码技术的库存管理系统设计分析
    [免费范文]基于RRAS与虚拟专用网技术在Windows中的实现
    [企业管理]基于会计主体的企业合并抵销处理
    [交通运输]浅谈基于创新能力培养的路基路面工程课程教学方法

    计算机论文
    普通论文关于信息技术的研究性学习浅谈
    普通论文水利工程计算机应用现状与思考
    普通论文利用桌面管理系统,提升信息安全
    普通论文防范ARP攻击
    普通论文基于USB接口的数据传输系统的
    普通论文基于Web技术的高校监考安排系统的
    普通论文公钥密码体制综述
    普通论文浅谈网络文化的后现代意蕴
    普通论文基于串口通信的智能大厦楼宇监测
    普通论文试论智能电网中计算机网络系统的
    普通论文胃癌中微淋巴管密度检测的意义
    普通论文基于WinDis 32技术实现网络通信监
    论文
    普通论文[今日更新]百度对家电维修搜索结果
    普通论文[今日更新]压缩机消声器的声学性能
    普通论文[企业管理]提高物流企业信息资源规
    普通论文[今日更新]农民权益保障视野下的我
    普通论文[免费范文]赴山东省市政公用事业改
    普通论文[免费范文]腹腔双套管两种不同连接
    普通论文[今日更新]2010年应届工商管理专业
    普通论文[今日更新]作业成本管理的产生及发
    范文大全
    普通范文[先进性教育]党性分析剖析材料
    普通范文[先进性教育]失地农民就业安置必须坚
    普通范文[零八零一]-土地整理工程资格预审申
    普通范文[调查报告]关于农民收入问题的调查
    普通范文[实习报告]建筑工地认识实习体会
    普通范文[范文大全]乡镇社会事务办公室2012
    普通范文[规章制度]志愿者管理手册
    普通范文[演讲稿]守住大学生的良知演讲稿
    演讲致词
    普通演讲[主持词]文艺晚会主持词
    普通演讲[竞聘演讲稿]检察院副科长竞争上岗演讲
    普通演讲[主持词]化妆品企业促销联谊会主持
    普通演讲[会议发言稿]财税工作|会讲话
    普通演讲[职场礼仪范文]办公室女郎拒绝上司原则
    普通演讲[节日祝福语]2011年元旦最新搞笑短信精
    工作范文
    普通公文方案[公文写作]我国工程机械租赁行业的现
    普通总结[工作总结]体检科年度工作总结
    普通公文方案[公文写作]职业经理人不愿意进入家族
    普通公文方案[公文写作]乡镇改革面临艰难抉择——
    普通公文方案[公文写作]基层司法所实行竞争上岗经
    普通总结[述职报告]2010年县政府社保述职报告
    普通领导讲话[思想宣传]在抗台抢险先进表彰暨迎峰
    普通总结[工作总结]机械设计制造专业技术工作
    普通总结[工作计划]2009—2010年第二学期教学
    普通汇报体会[心得体会]公安派出所所长对公安部大
    普通总结[工作总结]2009上半年林权制度改革工
    普通总结[半年总结]供销社2010年上半年工作总