基于相关性分析的学术资源搜索引擎整合研究.doc

资料分类:管理学院 上传会员:小七同学 更新时间:2019-08-23
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:11008
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:本文运用统计学手法,基于python,采用爬虫技术设计了一种整合学术资源的方法,并将所爬取到的不同学术资源搜索引擎的信息进行相关性分析,按照关联度由高到低进行输出,输出的内容可包括各个学术资源的标题,URL地址以及摘要等等。这样就节省了用户去多个不同的学术资源搜索引擎上搜索的时间,防止了资源浪费。同时,也方便用户筛选学术资源信息,不用盲目的进行寻找。本文以Wiley, SpringerLink这两个学术资源搜索引擎为例进行了整合,最终成功地获得了所需信息,正确地输出了要寻找的学术资源,完成了平台整合功能。

    该论文有图12幅,表1个,参考文献9篇。

 

关键词:学术资源搜索引擎  整合  爬虫  关联度分析  Python

 

目录

摘要

Abstract

1  绪论-1

1.1研究背景和研究意义-1

1.2 主要内容-2

2相关背景知识与理论-2

2.1 学术资源搜索引擎的概述-2

2.2 网络爬虫-3

2.3 Python语言-4

3学术资源整合平台的分析-5

3.1 概要-5

3.2 主要使用模块功介绍-6

3.3 相关性分析-7

4基于Wiley,SpringerLink平台资源整合的实现-7

4.1 Wiley学术资源搜索引擎爬取网页的实现-8

4.2 SpringerLink学术资源搜索引擎爬取网页的实现-12

4.3 Wiley,SpringerLink学术资源平台资源整合-15

5结论-23

参考文献-25

致谢-25

相关论文资料:
最新评论
上传会员 小七同学 对本文的描述: 实现学术资源平台的整合是未来学术界发展的新模式,也是推进学术资源平台发展的有效方式。针对各个学科而言,期刊,博硕论文库,书籍,文献等众多的智力资源,如何有效地整合......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: