基于Python的酒店网络爬虫开发与应用.docx

资料分类:管理论文 上传会员:林颖颖 更新时间:2022-04-26
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:9052
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:随着大数据时代的到来,网络数据成为了各行各业必不可少的资源。而随着网络上的数据数量巨大内容复杂,数据的获取和整理筛选需要有效的技术手段,网络爬虫就是因此而生。酒店网络爬虫顾名思义,就是针对网络上与酒店有关的数据进行爬取和整理,为酒店业的研究及分析提供真实有效的数据基础。本文章基于python语言的和其外部库,编写了用于酒店网络数据爬取的爬虫代码,此代码拥有运用灵活并且效率高等优点,并以大众点评网站为例进行实际应用。爬取了青岛市各星级所有酒店的信息,包括点名、价格、地址、交通等,对整理出的文本数据做出数据透视表进行分析,最后分析出酒店地址对不同星级酒店定价的影响程度。

关键字:酒店;大数据;网络爬虫;Python;数据分析

 

目 录

摘 要

ABSTRACT

一、前言-1

(一)什么是网络爬虫-1

(二)国内外研究现状-1

1.爬虫技术在现今各行各业的影响-1

2.爬虫技术在旅游领域的开发与应用-2

3.对现有爬虫技术研究的总结-2

二、酒店网络爬虫的设计与编程-3

(一)酒店网络爬虫需求分析-3

(二)酒店网络爬虫开发平台选择-3

1.目标网页的接口请求-3

2.网页抓取时的文本数据处理-3

3.拥有丰富的爬虫框架-4

(三)酒店网络爬虫的设计与实现-4

1.爬虫相关库-4

2.爬虫的请求头-4

3.爬虫的目标网页连接-4

4.爬虫的网页信息提取-5

5.爬虫的网页信息保存-5

6.爬虫的主函数-5

7.爬虫的运行-6

三、基于Python的酒店网络爬虫的应用-7

(一)爬虫应用实例-7

(二)对采集到的数据进行整理分析-8

(三)酒店价格透视分表分析-9

1.五星级酒店平均价格走势分析-9

2.四星级酒店平均价格走势分析-10

3.三星级及以下酒店平均价格走势分析-11

(四)酒店网络爬虫的应用前景-12

四、结语-13

参考文献-14

致  谢-15

相关论文资料:
最新评论
上传会员 林颖颖 对本文的描述:爬虫软件的编写可以由任何计算机语言实现,目前IT领域的计算机编程语言分9个大类,其中包括多达123种面向不同领域的语言。通过行业内对于爬虫软件的语言使用趋势以及对常用编程......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: