基于大数据的学生成绩关联因素分析.docx[原创毕业论文]

需要金币：1000 个金币	资料包括：完整论文
转换比率：金额 X 10=金币数量，例100元=1000金币	论文字数：14958
折扣与优惠：团购最低可5折优惠 - 了解详情	论文格式：Word格式(*.doc)

上一篇：基于W5500的雾霾监测系统设计.doc

下一篇：基于互联网的大学生聚会服务网站设计.doc

摘要:随着国家不断调整教育结构，各高校不断扩招，学生和教师的数量大幅增长。给教学和管理工作带来了严峻的考验，由于缺乏必要的技术和手段，管理人员只能通过传统方法进行统计分析，未能发现数据背后重要的有效信息。

本文研究了基于校园卡数据的预测方法，利用校园卡数据，提取了图书馆借阅、校园卡消费、宿舍门禁、图书馆门禁、学生成绩等数据的数据特征。对这些数据进行数据预处理，从地点维度、时间维度、消费方式维度进行特征提取。利用机器学习XGBoost算法的方法来预测影响学生成绩的关联因素，得到图书馆学习天数，学习次数等重要影响因素，从而帮助同学改变学习方法，帮助老师改变教学方式。

关键词：机器学习；Python；XGBoost算法；关联规则

摘要

Abstract

1 绪论-1

1.1研究背景及意义-1

1.2 国内外现状及发展趋势-1

1.2.1 国内现状及发展趋势-1

1.2.2 国外现状及发展趋势-1

1.3本文主要内容及结构安排-2

2.数据挖掘及机器学习综述-3

2.1数据挖掘-3

2.1.1 数据挖掘概念-3

2.1.2 数据挖掘过程-3

2.2 机器学习-4

2.2.1 机器学习概念-4

2.2.2 机器学习主要任务-4

2.2.3开发机器学习应用程序的步骤-5

2.2.4 Python语言-5

2.3 数据挖掘相关技术-6

2.3.1 关联规则算法-6

2.3.2 决策树算法-6

2.3.3聚类分析-6

2.4 本章小结-6

3 关联规则数据挖掘算法分析-7

3.1 关联规则-7

3.2关联规则经典算法Apriori算法-7

3.2.1 Apriori定义-7

3.2.2 Apriori算法的一般过程-7

3.3使用Apriori算法来发现频繁集-8

3.3.1 生成候选项集-8

3.3.2 组织完整的Apriori算法-8

3.4从频繁项集中挖掘关联规则-8

3.5本章小结-9

4 学生成绩数据关联因素分析的设计与实现-10

4.1 问题简述-10

4.2 数据准备-10

4.3 特征工程-10

4.3.1特征构造-10

4.3.2 特征处理-11

4.3.3特征选择-12

4.4 模型选择-12

4.4.1 Random Forest(随机森林)算法-12

4.4.2 GBDT算法-12

4.4.3 XGBoost算法-13

4.5模型融合及参数调优-13

4.5.1模型融合和模型选择的区别-13

4.5.2 模型融合方法-13

4.5.3 参数调优-14

4.6实验数据说明和处理-14

4.7实验评估指标-15

4.8实验结果-15

4.9 本章小结-15

结论-16

参考文献-17

附录A 程序-18

附录B 结果-20

致谢-38

混合气体分析仪设计.doc	B市某综合楼空调工程设计+CAD图纸.rar	基于Java语言对学生管理系统的开发与研究
局域网聊天软件的设计与实现.doc	基于单片机的全自动洗衣机控制系统设计	掩护式液压支架设计.rar
南输成品油管道首站工艺设计_油气储运	基于UDP局域网聊天软件的设计与实现.do	轮胎压力检测系统设计.rar
基于VC的视屏监控程序设计.doc	2GHz新型手机天线设计_电子信息工程.rar	基于STM32的音乐频谱显示系统设计.doc