| 网站首页 | 范文 | 演讲致词 | 汇报体会 | 总结报告 | 公文方案 | 领导讲话 | 党建工会 | 论文 | 文档 | 书信 | 
您现在的位置: 范文大全网 >> 论文 >> 企业管理 >> 正文 用户登录 新用户注册
浅谈基于内容管理系统中内容分类实现方法的研究           
浅谈基于内容管理系统中内容分类实现方法的研究
论文关键词:内容管理系统 内容分类 方法
论文摘要:随着信息量以爆炸般的速度在急剧增长,当前在信息管理方面所面临的最严峻的挑战不再是信息匾乏,而是缺少时间和精力来对如此众多的信息进行分析、归类与操作。本文探讨了在内容管理系统中内容分类的实现方法。
0 引言

随着信息量以爆炸般的速度在急剧增长,当前在信息管理方面所面临的最严峻的挑战不再是信息匾乏,而是缺少时间和精力来对如此众多的信息进行分析、归类与操作。因此内容的分类不仅有利于更快捷地实现内容的查询,而且有效的分类方法同样有助于对纷杂的信息进行组织与归类,有助于人们缩小查询的范围,节省时间和精力。可见内容管理对内容分类的要求是十分必要的。
现在分类的方法大体上分为人工分类、自动化分类以及人机结合的混和方法三种。显而易见,人工分类是最容易被想到的。但是这种方法显而易见的过多的依赖于个人,且成本太高。并且当内容量过大的时候,单单依靠手工方法进行分类也不太现实,很容易成为系统的瓶颈。因此,人们更加关注于自动化分类方法。现在主要应用的自动化分类方法主要有以下几种方法。

1 自动化分类方法

1.1 基于规则的分类方法:这种方法需要由对相关内容极为了解的专家创建与维护一套规则用于将某篇文档划分到某个类中。专家使用if-then的规则形式组织归类的相关概念。规则能够支持复杂的操作,而且建立在规则之上的决策树也相当准确。规则衡量了一个给定的文档是否符合某个主题的判断标准。loCaLhOSt显然,建立这样一种规则并不容易,并且专家对相关内容知识的了解程度也相当重要。
1.2 基于自然语言的学习算法:该方法利用神经网络的方法,通过分析文档的内容区分文档并将文档进行分类。由于这种方法具有较高的容错能力及语言独立的操作性等特点,正在成为一种相对稳定的分类方法。这种方法通过选择文档的表示方式或可能的格式,利用神经网络实现对内容的分类,可以被应用到文本文档或文本片断的分类中去。
1.3 语义分析:这是以从文档中提取关键的概念作为分类与检索的基础。语义分析过程共分为两个阶段,第一个阶段的工作主要集中于一系列的语言算法以及语言独立的统计技术的实现。当用户对系统中收集的信息进行查询时则触发该过程的第二阶段,系统可以根据用户的查询需求以及可视化的分类结构呈现给用户个性化的、相关的查询结果。
1.4 模式匹配:这种方法是指寻找经常聚在一起的一组词或词组的过程。一个主题可能通过语义分析进行处理。其他的识别模式还包括词在文档当中的出现频率、词的位置、词与词之间的亲近程度以及相关词的聚类。模式匹配方法具有语言独立的特点。
1.5 聚类分析:这是通过识别内容中的共性元素将内容划分为相似内容子集。每篇文档可以看作一些内容的合集,聚类本质上就是将每一袋中的相似内容聚为一组。
以上每一种分类方法都有其自身的优点与不足,没有哪一种单一的分类方法是十全十的。每种方法都有其适用的方面。所以,现在人们往往采用混合的分类方法。下面我们着重分析一种基于神经网络的分类方法。

2 基于聚类分析的分类方法

聚类分析是一种解决分类问题的探测性的数据分析方法。它的目标是把人、事务、事件等聚为组或类,每一类描述它的对象所属的类。该方法是通过建立一个对象间的相似性度量,使得类间的相似性尽量小,而类内的相似性尽量大,从而得到在某种判别准则之下的最佳分类,这种分类的结果未必使用简单的概念就可以描述的。换言之,其分类的标准并不是显而易见的。
假设特征向量由n个特征参数x,x,…,x组成聚类分析按照一定的准则,将这些特征向量点划分为若干个群。聚类也用于将一个内容的集合划分为子集,也就是类。每一类内的对象之间都比该类对象与属于其它类的对象之间具有更大的相似性。
芬兰学者t.kohonen提出一种可以使得输入信号映射到低维空间,且保持相同特征的输入信号在空间上对应邻近区域的学习方式,称为kohonen自组织特征映射(self-organizing feature maps, sofm)也称kohonen自组织神经网络。

kohonen自组织神经网络是一种前馈型网络。在这种类型的神经网络中各神经元接受前一层的输入,并输出给下一层,没有反馈。节点分为两类,即输入单元和计算单元,每一计算单元可有任意多个输入,但只有一个输出。前馈网络可分为不同的层,第i层的输入只与第i-1层的输出相连,输入和输出节点与外界相连,而其它中间层则称为隐层。
前馈型网络,由于kohonen自组织特征映射网络除了具备以下主要性能,因此采用kohonen自组织神经网络来实现内容的聚类。①对输入数据有聚类作用,并可用聚类中心代表原输入,起到数据压缩作用。②保持拓扑有序性,输入中特性相似的点映射后在空间上是邻近的。③分布密度匹配,原数据中分布密的区域在映射图上对应较大的区域,分布稀的则对应的区域也较小。
自组织网络采用没有指导的学习过程,不必给定应有的输出,训练数据只有输入而没有输出,网络只靠输入模式本身的特征,根据一定的判断标准自行修改单元连接的强度,使权矢量在输入向量空间中的分布近似于样本的分布。这也就是为什么采用自组织神经网络来解决内容的分类问题的原因和依据,因为在对内容进行聚类前,可以分成什么样的类以及不同的内容归属的类别本来就是未知的。

3 实现的步骤及方法

在此研究一种利用智能技术得到内容的分类结构的方法。该方法通过人或统计工具对文本内容进行预处理,将文本内容以标准化的特征向量表示,然后利用kohonen自组织特征映射网络实现内容的自动聚类。现将对文本内容进行聚类的方

[1] [2] 下一页

  • 上一个论文:

  • 下一个论文:


  • 看了《浅谈基于内容管理系统中内容分类实现方法的研究》的网友还看了:
    [法律论文]浅谈我国经济犯罪死刑的废止
    [法律论文]浅谈农村基层组织工作人员渎职罪主体资格探析
    [法律论文]浅谈文化迁徙与思想政治教育环境的关系
    [法律论文]浅谈渣滓洞看守所被关押人员被捕原因略考
    [法律论文]浅谈马锡五审判方式对现代司法制度的影响
    [法律论文]浅谈在《东盟宪章》下解决当前法律问题
    [法律论文]浅谈破除制约瓶颈、拓展路径空间,不断开创消防法
    [法律论文]浅谈有关司法实践中风俗习惯的适用分析
    [法律论文]浅谈对歌曲作品的认定以及对歌曲作品权利主体的认
    [电子机械]浅析基于可靠性工程的电子信息装备质量管理研究

    企业管理
    普通论文探析辅助生产费用的计划成本分配
    普通论文金融危机形势下大学生择业思考
    普通论文人力资本理论框架下浅谈中国的教
    普通论文浅议如何加强我国管理会计的应用
    普通论文从企业经营成本管理谈诚实守信
    普通论文中国企业学三星:陷于“术”而疏
    普通论文对加强会计职业道德建设有关问题
    普通论文建筑施工企业成本管理有关问题研
    普通论文浅析论房地产企业体验营销战略的
    普通论文浅谈超市经营中的精细营销
    普通论文企业集团财务控制模式探讨
    普通论文浅析激励机制在学校教师管理中的
    论文
    普通论文[今日更新]论歌唱艺术表现的协调与
    普通论文[工程建筑]高层建筑施工安全管理问
    普通论文[免费范文]抓好“职工之家”建设,
    普通论文[经济论文]新时期供销社在农村合作
    普通论文[今日更新]温馨中秋短信
    普通论文[免费范文]项目管理 BPR实施中常用
    普通论文[免费范文]2007年湖北仙桃市招商引
    普通论文[免费范文]办公室里的企业文化
    范文大全
    普通范文[范文大全]中医药服务发展情况汇报
    普通范文[范文大全]中学生2010年通用版入团
    普通范文[个人简历]德能勤绩个人自我鉴定总
    普通范文[实习报告]幼儿园教育实习总结
    普通范文[范文大全]镇党委书记履行基层党建
    普通范文[范文大全]计生工作学习考察报告
    普通范文[规章制度]关于开展关爱女孩行动工
    普通范文[范文大全]党课学习《党章》心得体
    演讲致词
    普通演讲[会议发言稿]在市文联“三新”主题教育
    普通演讲[庆典致辞]圣诞节贺词(贺辞)集
    普通演讲[节日演讲稿范文]五一国际劳动节演讲稿
    普通演讲[婚礼大全范文]婚前点滴  幽默新郎新娘准
    普通演讲[主持词]2007年公司员工春节联欢会
    普通演讲[开业开幕]在全民自行车健身比赛开幕
    工作范文
    普通公文方案[公文写作]新经济时代企业文化的新特
    普通公文方案[公文写作]农村建筑业税收管理分析
    普通总结[工作计划]2009年人事教育处工作计划
    普通公文方案[企划方案]公司目标管理责任书
    普通公文方案[合同范本]商品代销合同(示范文本)
    普通党建工会[政府政务]在全市消防安全集中整治工
    普通汇报体会[思想汇报]2009年国庆阅兵有感思想汇
    普通总结[工作汇报]会计信息质量检查工作情况
    普通公文方案[公文写作]维维:全力打造乳业航母
    普通公文方案[公文写作]--对xxx县财政运行状况的调
    普通汇报体会[先进事迹材料]优秀教师事迹材料:学高为
    普通总结[年终总结]市综合招标投标交易中心年