数据挖掘算法与应用--CART算法分析.docx

资料分类:教育理论 上传会员:潘教授 更新时间:2021-09-03
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:9231
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要: 当今社会完全步入了一个高度信息化的时期,每分钟都会涌现大量的信息,怎么从这些大量的数据中提取出对我们有用的信息,并为我们创造价值,这成为了一个关键的话题。基于数据挖掘来研究数据,从中提取有用的信息来辅助决策。近几年来,数据挖掘技术不仅作为数据库和信息决策领域前沿的研究方向之一,还受到了经济领域和数据库界的共同关注。

本文以基于数据挖掘理论、方法、技术上的决策树为建模主要思想,选用决策树中Gini指数的分类和回归树(CART)算法,再通过:构建树、修剪树、评估模型,将客户进行分类,将客户信息转化为属性-结论式的输出形式,从而使区分目标客户及非目标客户变得快速且精准。

在数据挖掘技术模型的基础上,最终能够得到最优化模型。此模型反应出一系列我们期待的特点,如时间短、精度高等。在实际生活中使用我们得到的最优化模型,无论是个人还是企业,都可以提高客户分类的效率。

 

关键词:数据挖掘; 决策树; CART算法;客户

 

目录

摘要

Abstract

一、引言-5

(一)论文的研究背景及意义-5

(二)论文的选题目的-5

二、数据挖掘理论-6

(一)数据挖掘基本概念-6

(二)数据挖掘的功能-7

(三)数据挖掘过程-8

三、关于客户分类-8

(一)客户分类的概念-8

(二)微博客户分类的意义-8

(三)微博客户操作流程-9

(四)微博客户分类中的具体应用-9

1.客户现状及问题描述-9

2.研究目标-9

四、CART算法-10

(1)构建树-11

(2)数据预处理-11

(3)CART树的生成-11

(4)树的剪枝-12

(5)CART树的最优选择-14

五、CART算法在新浪微博中的具体应用-14

(一)问题定义-15

(二)数据准备-15

(三)数据变换-17

(1) 数据的预处理-17

(2)将数据分类汇总-17

(3)变量值确定方法-18

(四)CART算法的具体应用过程-19

(五)CART算法的不足与改进-20

1. CART算法的不足-20

2. CART算法改进-20

参考文献-21

致谢-21

相关论文资料:
最新评论
上传会员 潘教授 对本文的描述:数据挖掘是从大量数据中找出规律的技术,它是在没有任何前提假设的情况下去挖掘庞大信息、从中发现有用信息。从中获取的信息都具有有效性、实用性与未知性三个特征。数据挖掘......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: