统计方法在移动通信网络优化管理的应用 |
|
|
类。 本节我们将根据多维度评估对KPI的分类,分别对指标进行k-均值聚类,我们采用Matlab 7.1软件和数理统计工具箱的kmeans函数[5][6][7]来进行聚类。在这个阶段,K值(分类)的选择是是十分重要的,如果K取值过小,则不能发现有效的分类模式,使划分失去了意义;如果K值取值过大,分类指标将变得琐碎,各类之间的特征区分不是特别明显,对指导管理经营活动没有操作性。根据以往业务经验,分别取值2~5对样本进行尝试计算,然后用silhouette值观测区分确定有效的K值(分类数)。Silhouette值数据点与它本身聚类中的点的距离比上它与其他聚类中的点的距离, S(x)= minb(x,y)-a(x,y) max(a(x,y),minb(x,y)),其中b(x,y)=avg(d(x,y)),是x点与除开与x在同一聚类的点的平均距离。a(x,y)是x点与其同处于 一个聚类的点的平均距离。[9] 2.1话务量、数据量分类 我们以2010年11月1日至2011年2月23日表示话务量的指标——TCH话务量(峰值)和表示数据量的指标——PDCH占用数(20点),先对日指标求最大值,然后进行二维K-均值聚类。编辑:www.ybask.Com 。 我们设分类数K=2,3,4,5进行K-均值聚类,画出Silhouette图。 从图4中我们可以看出,21个地市按TCH话务量(峰值)、PDCH占用数(20点)分类,当K=2和4,各组区分于其他组的Silhouette值大部分都比较大(大于0.6),并且没有负值,说明分类比较好。 表2 TCH话务量(峰值)、PDCH占用数(20点)K-均值聚类(2010-11-1~2011-2-23) 从表2中可以看出,地市关于话务量和数据业务量的分类,符合当前人们对该地市的社会经济发展各因素的理解,因此可以作为地市网优管理分类的重要参考。 3结论 移动通信网络指标异常值的挖掘是一个很有实际意义的问题。目前从物理上没有确切的模型做为发现异常值的先验参考;在少样本,其他因素剧烈影响的影响和非标准环境上一页 [1] [2] [3] [4] [5] 下一页 |
|
|
|
上一个论文: 县乡统计方法制度改革创新探索 下一个论文: 浅谈医学统计方法在临床医学科研中的应用 |
|