几种聚类算法的比较_应用数学专业.doc

资料分类:科技学院 上传会员:love音乐 更新时间:2014-09-24
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:13715
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:现在社会处于大数据时代,各行各业的巨量数据都需要先进行数据处理后才能使用,这时候就需要先用聚类分析法对这些数据进行筛选。随着数据容量的不断扩充,聚类分析各算法处理数据的效率问题开始突现出来。本文通过对聚类分析常用的四种算法的定义进行比对,分析他们的不同之处。然后找到这四种算法最具代表性的最新的算法--K-modes、K-均值、最近邻、两部步骤法,通过matlab的编程实现,然后把UCI机器学习数据集储存库中的鸢尾花、酒、豌豆、动物园四个数据集进行实验,并计算出每种方法的处理时间和正确率;然后在引用了一个较大的数据集,再次实验。然后用Weka数据挖掘软件对这五个数据实验,综合得出效率最高的聚类分析法。研究的目的是为大数据聚类分析找到一个便捷快速的途径。

关键字:Matlab  时间函数  实验  聚类  NP难问题

 

目录

摘要

Abstract

一、引言 3

(一)聚类分析的简介 3

(二)聚类过程 3

(三)聚类分析的应用 3

(四)聚类分析对聚类算法的要求 4

二、主要的聚类算法分析 5

(一)顺序聚类 7

(二)层次聚类 8

(三)划分聚类10

(四)基于密度的聚类11

(五)基于网格的聚类13

三、实验14

(一)数据集14

(二)时间函数14

(三)实验17

(四)更大数据集的测试18

(五)Weka下的聚类实验 19

(六)结论19

四、总结20

参考文献 21

相关论文资料:
最新评论
上传会员 love音乐 对本文的描述:聚类具体的来说,就是把相似的对象通过静态归类的方法分为不一样的组别亦或是更多的集合,这样使得在同一个子集中的样本之间都或有相通的一些属性,而不同的集合之间,共性很......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: