聚类搜索引擎研究进展浅析 |
|
|
stering methods and application states, and finally gives the research trends of clustering search engines. Key words: web data; clustering search; clustering algorithm 随着互联网技术和互联网应用系统的快速发展,各个领域的互联网应用系统都已经积累了海量的Web数据,包括产品数据、用户数据、评价数据、关联数据、状态数据等等。这些数据不仅内容极其丰富,而且很大程度上都开放给互联网用户,可以免费的访问、下载和处理。这就为进一步集成和开发这些Web数据的潜在价值,建立增值应用提供了重要基础。聚类搜索是近年来发展最为迅速的互联网数据集成和增值技术。聚类搜索是在垂直搜索基础上发展起来的新型搜索技术。垂直搜索是主要针对行业的专业搜索,侧重于某一行业领域,其目的是使用户能够更加方便地找出所需的专业信息。而聚类搜索是为了进一步提高搜索的精度使其符合用户的搜索习惯和兴趣,在搜索引擎的搜索结果中进行聚类,把搜索出来的信息进行分类处理,将使信息资源更加清晰明了。 目前国内对聚类搜索引擎的综述主要见于文献 [1]和文献[2],虽然这两篇文章对聚类搜索引擎进行了很好的综述和分析,对聚类搜索引擎的形成和发展过程进行了说明,并对主流聚类搜索系统进行了测评和分析,但是对于聚类系统的功能分析还不够详尽,对于聚类搜索引擎未来的发展没有给出明确的定位。 本文首先给出了典型聚类搜索引擎系统的基本工作流程,对聚类搜索引擎的发展历史和现状进行了概括式综述,然后从聚类对象、聚类功能和聚类算法三个角度对聚类搜索引擎进行研究,并全面分析了若干著名聚类搜索引擎。 本文结构:第1节介绍聚类搜索引擎的发展现状;第2节对聚类搜索引擎的功能进行分析;第3节对典型聚类搜索引擎进行综述;第4节描述聚类搜索引擎的发展趋势;第5节总结全文。 1 聚类搜索引擎的研究现状 1.1 聚类搜索引擎概念和工作过程 所谓聚类搜索引擎,就是运用聚类技术对搜索结果进行自动聚类分析的搜索工具。其特点是去重性强、分类性强、汇集性强,即可以及时去除重复信息,对搜索的结果进行分门别类上一页 [1] [2] [3] [4] [5] [6] [7] [8] 下一页 |
|
|
|
上一个论文: 关于高校体育教育专业运动心理学研究现状 下一个论文: 国学热与国学的定位和前瞻 |
|