| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:9052 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:随着大数据时代的到来,网络数据成为了各行各业必不可少的资源。而随着网络上的数据数量巨大内容复杂,数据的获取和整理筛选需要有效的技术手段,网络爬虫就是因此而生。酒店网络爬虫顾名思义,就是针对网络上与酒店有关的数据进行爬取和整理,为酒店业的研究及分析提供真实有效的数据基础。本文章基于python语言的和其外部库,编写了用于酒店网络数据爬取的爬虫代码,此代码拥有运用灵活并且效率高等优点,并以大众点评网站为例进行实际应用。爬取了青岛市各星级所有酒店的信息,包括点名、价格、地址、交通等,对整理出的文本数据做出数据透视表进行分析,最后分析出酒店地址对不同星级酒店定价的影响程度。 关键字:酒店;大数据;网络爬虫;Python;数据分析
目 录 摘 要 ABSTRACT 一、前言-1 (一)什么是网络爬虫-1 (二)国内外研究现状-1 1.爬虫技术在现今各行各业的影响-1 2.爬虫技术在旅游领域的开发与应用-2 3.对现有爬虫技术研究的总结-2 二、酒店网络爬虫的设计与编程-3 (一)酒店网络爬虫需求分析-3 (二)酒店网络爬虫开发平台选择-3 1.目标网页的接口请求-3 2.网页抓取时的文本数据处理-3 3.拥有丰富的爬虫框架-4 (三)酒店网络爬虫的设计与实现-4 1.爬虫相关库-4 2.爬虫的请求头-4 3.爬虫的目标网页连接-4 4.爬虫的网页信息提取-5 5.爬虫的网页信息保存-5 6.爬虫的主函数-5 7.爬虫的运行-6 三、基于Python的酒店网络爬虫的应用-7 (一)爬虫应用实例-7 (二)对采集到的数据进行整理分析-8 (三)酒店价格透视分表分析-9 1.五星级酒店平均价格走势分析-9 2.四星级酒店平均价格走势分析-10 3.三星级及以下酒店平均价格走势分析-11 (四)酒店网络爬虫的应用前景-12 四、结语-13 参考文献-14 致 谢-15 |

