处理的各类文档集中在一个平台下统一管理,但外部特征管理、关键词管理等功能的理论价值可能高于实际应用价值,之所以增添这些功能,并不是它们有多大用处,而是技术上易于实现。
2.文本挖掘与检索
知识管理技术面临的重大挑战是如何在海量的非结构化文档中又快、又准、又全地找到用户所需的文档。毫无疑问,检索是知识管理的核心技术,但遗憾的是,这方面的技术没有多大进展。
从原理上,检索可以采取两种方案:其一是将文档归入一个有序的结构,再按结构规则提取文档(检索),这种方法也被称为“文本挖掘(text mining)”;另一种方案是不建立结构,在检索时,用户自由地输入检索词或短语,由系统进行匹配,并将匹配到的文档按检索词出现频率的统计规则提供给用户,这就是全文检索。
结构化方案本身又可分为两种:其一是由机器根据文档特征,按一定算法自动建立有序的结构,并将文档归入该结构;其二是人工建立结构,再人工将文档归入结构。第一种方法的代表产品是ibm的text miner和autonomy公司的concept agent。在第二种方法中,最常采用的结构是树状分类表,该分类表由本领域的专家编制,再由“知识工程师”按文档内容将它归入某一个最终子类,检索时可按树状结构一层一层地找到文档。这种方法的问题是分类规则有很强的主观性,与编制者对该领域的理解有很大关系。也就是说,客体并不能被表达成惟一的分类表,这就给文档的归类和检索造成了困难;另一方面,分类表灵活性差也是存在的问题之一。
除分类表外,还有另一种方法,这就是结构化的概念集合——主题词表。它将本领域的主要概念(主题词)收集在一起,给出概念间的相互关系:并列、同意、上下位等;然后再将文档按其内容所涉及的主题,从主题词表中选出若干个概念,作为该文档的标识,并存入数据库。以后,只要从主题词表中选出合适的主题词,就可以提取文档。主题法适用于计算机检索,灵活性较分类法好,但主题词表的编制很困难,给文档赋予主题词(标引)也较分类法困难,这些都是“主题法”的不足。
全文检索的好处是技术上容易实现,但它的查准率和查全率都不算好。常常可能遇到这样的情景:搜索引擎自动检索出的绝大多数文献都不是您想要的。出现这种情况的原因有两点:一是检索者用的检索词其实并不是该专业的通用术语;另一个原因是文档的主题与检索词出现的频率相关度不高。尽管如此,全文检索在目前仍然是知识管理系统的标准文档检索方案,因为除此之外,再没有性价比更好的实用技术了。
从现有的知识管理案例来看,小型知识管理项目(文档数量较少或组织规模较小)采用全文检索加文档管理就可以了。但在中大型项目中,全文检索就不够用了,应该应采用结构化的方法。对于那些核心业务十分依赖于信息提取的项目,诸如专利管理、政府的文档管理、大型制造业项目、保险项目、医院病案项目、大型零售项目等,就只能采用人工建立结构、人工进行标引的方法。如果对系统性能要求较高,“主题法”应是首选的方案。
3.企业门户
现在,企业门户已经成为知识管理系统的标准配置。对用户来说,企业门户是信息系统的惟一界面,日常工作的一切事务都可在企业门户中完成。例如,在企业门户中可以打开各类文档进行编辑、访问数据库、访问internet和intranet、收发邮件、进入工作流操作等。企业门户还可以按不同需求定制。总之,企业门户试图将日益复杂的应用集成到一个统一的平台上。
表面看来,企业门户是计算机应用日趋复杂多样以后,由繁至简的一种进步,但事实也许并不是这样。各种功能集成在一起会相当复杂,实现起来并不容易,也不一定好用。到目前为止,打出企业门户旗号的主要是小公司,大公司中只有lotus推出了k-station,而微软的产品尚处于测试阶段。
上一页 [1] [2]