基于SPARK的电商用户行为分析平台的设计与开发.doc

资料分类:计算机信息 上传会员:狂奔的小猪 更新时间:2021-11-18
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:13215
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:基于SPARK的电商用户行为分析平台主要实现了包括用户访问Session分析、页面单跳转化率统计、热门商品离线统计和广告流量实时统计这四个业务模块。通过平台的业务模块,可以细化出Session访问步长和访问时长占比统计、随机抽取Session、获取前十热门商品品类、获取前十热门商品品类活跃Session、页面单跳转化率、各区域热门商品统计模块、广告统计用户黑名单、广告点击流量实时统计、实时统计各省的热门广告和最近一小时广告点击趋势等这十个功能。平台通过Spark Core、Spark SQL和Spark Streaming三个框架进行开发。因为Spark技术的底层是使用Scala实现的,因此应用Scala语言进行开发,效率会更高,代码也会更简洁。同样,MySQL数据库是开源和免费的数据库,同时也是应用比较广泛的数据库,因此本平台采用MySQL数据库进行存储最后计算出的分析结果。 

 

关键词:电商平台;Spark技术;Scala语言

 

目 录

摘 要

Abstract

1  前言-1

1.1  课题的背景-1

1.2  课题的目的与意义-1

1.3  国内外该课题的发展现状-1

1.4  设计的指导思想和技术-2

1.4.1   SparkCore介绍-2

1.4.2   SparkSQL介绍-2

1.4.3   Spark Streaming介绍-2

1.4.4   MySQL数据库介绍-2

1.5  设计应解决的主要问题-3

2  可行性分析-4

2.1  技术可行性分析-4

2.2  经济可行性分析-4

2.3  操作可行性分析-5

3  平台设计-6

3.1  平台总体介绍-6

3.2  平台功能模块的详细分析与介绍-7

3.3  数据模型-9

4  平台实现-13

4.1  用户访问Session模块-13

4.1.1  Session访问步长和访问时长占比统计表-13

4.1.2  随机抽选Session-13

4.1.3  获取Top10商品热门品类-14

4.1.4  获取Top10商品热门品类的活跃Session-15

4.2  页面单跳转化率模块-15

4.3  各区域热门商品统计模块-16

4.4  广告点击流量实时统计分析模块-17

4.4.1  广告统计用户黑名单-17

4.4.2  广告点击流量实时统计-17

4.4.3  实时统计各省的热门广告-18

4.4.4  最近一个小时广告点击趋势-19

5  平台测试-20

5.1  平台测试的目的-20

5.2  平台测试-20

5.2.1  用户访问Session模块的测试-20

5.2.2  页面单跳转化率模块的测试-20

5.2.3  各个区域热门商品Top3统计模块的测试-20

5.2.4  广告点击流量实时统计分析模块的测试-21

结    论-22

参考文献-23

谢    辞-24

相关论文资料:
最新评论
上传会员 狂奔的小猪 对本文的描述:电商用户行为分析就迎合了这个主题,通过整体电商用户留在电商平台的浏览情况,购买情况,可以分析出一个消费趋势,这个分析结果就是顾客的购买状态。企业可以根据分析结果对......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: