基于Weka数据挖掘策略研究与实践.doc

资料分类:本科论文 上传会员:晓萱 更新时间:2017-01-13
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:11331
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:当今开源软件界出现一匹黑马——数据挖掘工具Weka,Weka涵盖了很多能进行数据挖掘任务的数据挖掘策略:对数据进行处理、聚类、分类、关联还有全新的可视化交互式界面。Weka在中国的流行促使大家不断努力的完善Weka,在Weka工具上添加更多的机器学习算法,使Weka的功能越来越强大的同时界面也变得越来越友好,这些努力Weka可以和收费的数据挖掘工具抗衡。

本文主要内容是使用两种数据挖掘算法,决策树C4.5和关联规则Apriori算法,分别挖掘两个数据集。记录实验过程,分析评估实验结果,结论。由wages数据集挖掘结果可知:工资水平跟学历,社会经历,性别,和婚姻状态有关。由weather数据集结果可知:是否出去游玩跟温度,天气预报,天气状况有关。由iris数据集可知:鸢尾花的种类跟花瓣长度跟宽度有关。

 

关键词:Weka 数据挖掘 决策树 关联规则

 

目录

摘要

Abstract 

引言

1 绪论-2

1.1 课题研究背景及意义-2

1.2 国内外数据挖掘的研究现状、进展及应用-2

1.3 课题意义-3

1.4 本文组织结构-3

2 WEKA工具下的数据挖掘-4

2.1 数据挖掘主要步骤-4

2.2 WEKA平台介绍-4

2.2.1 WEKA图形用户界面简介-5

2.2.2 各种图形用户界面功能简介-6

2.2.3 WEKA核心数据结构-6

3 WEKA工具下的决策树算法实验-8

3.1 决策树算法基本介绍-8

3.2 决策树算法评价指标-8

3.3 决策树算法性能分析-9

3.3.1决策树算法性能分析实验-9

3.3.2决策树算法性能分析结果-11

3.4 J4.8算法下的数据挖掘-14

3.4.1 数据集的准备-14

3.4.2 数据预处理-15

3.4.3 算法的运用-19

3.4.4实验结果-23

3.5 J4.8算法下挖掘另一个数据集-25

4 WEKA工具下的关联规则实验-29

4.1 关联规则基本介绍-29

4.2 关联规则经典算法——Apriori-29

4.3 Apriori算法下的数据挖掘-30

4.4 使用Apriori算法挖掘Weather数据集-32

结论

致谢

参考文献

相关论文资料:
最新评论
上传会员 晓萱 对本文的描述:据挖掘的方式有两类:即直接数据挖掘与间接数据挖掘。 直接数据挖掘是指目标是利用原始数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: