需要金币:1000 个金币 | 资料包括:完整论文 | ||
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:9231 | ||
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要: 当今社会完全步入了一个高度信息化的时期,每分钟都会涌现大量的信息,怎么从这些大量的数据中提取出对我们有用的信息,并为我们创造价值,这成为了一个关键的话题。基于数据挖掘来研究数据,从中提取有用的信息来辅助决策。近几年来,数据挖掘技术不仅作为数据库和信息决策领域前沿的研究方向之一,还受到了经济领域和数据库界的共同关注。 本文以基于数据挖掘理论、方法、技术上的决策树为建模主要思想,选用决策树中Gini指数的分类和回归树(CART)算法,再通过:构建树、修剪树、评估模型,将客户进行分类,将客户信息转化为属性-结论式的输出形式,从而使区分目标客户及非目标客户变得快速且精准。 在数据挖掘技术模型的基础上,最终能够得到最优化模型。此模型反应出一系列我们期待的特点,如时间短、精度高等。在实际生活中使用我们得到的最优化模型,无论是个人还是企业,都可以提高客户分类的效率。
关键词:数据挖掘; 决策树; CART算法;客户
目录 摘要 Abstract 一、引言-5 (一)论文的研究背景及意义-5 (二)论文的选题目的-5 二、数据挖掘理论-6 (一)数据挖掘基本概念-6 (二)数据挖掘的功能-7 (三)数据挖掘过程-8 三、关于客户分类-8 (一)客户分类的概念-8 (二)微博客户分类的意义-8 (三)微博客户操作流程-9 (四)微博客户分类中的具体应用-9 1.客户现状及问题描述-9 2.研究目标-9 四、CART算法-10 (1)构建树-11 (2)数据预处理-11 (3)CART树的生成-11 (4)树的剪枝-12 (5)CART树的最优选择-14 五、CART算法在新浪微博中的具体应用-14 (一)问题定义-15 (二)数据准备-15 (三)数据变换-17 (1) 数据的预处理-17 (2)将数据分类汇总-17 (3)变量值确定方法-18 (四)CART算法的具体应用过程-19 (五)CART算法的不足与改进-20 1. CART算法的不足-20 2. CART算法改进-20 参考文献-21 致谢-21 |