需要金币:1000 个金币 | 资料包括:完整论文 | ||
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:16621 | ||
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:随着互联网科技的不断发展,它的影响已经融入了人们生活的方方面面。本文主要对智能问答系统进行研究,并将其限定在计算机基础课程问答领域。通常我们遇到问题会去查询百度或谷歌等搜索引擎,搜索引擎会根据输入的关键字返回包含关键字的很多网页。问题在于搜索引擎返回的信息太多,需要我们进行二次筛选,这将增加我们获取答案所需的时间。我们想要的仅仅是一个比较准确的答案,而不是长篇大论的文章。为了提高学生学习的积极性,并返回一个准确的答案给用户,减少用户获取答案的时间。本文有针对性的提出基于计算机基础课程问题的智能问答系统的研究,为学生们提供良好的服务。 本文以网络论坛中常见的计算机基础课程问题作为数据样本集,创建FAQ(Frequently Asked Questions)库。根据用户所提问题在FAQ库中查询,返回相似度最高的答案给用户。在问答系统中对问句的分类是很重要的一步,分类的准确性决定了答案筛选的准确性。本文采用基于规则的方法判定问句的类型,并利用LibSVM对问句所属学科类别进行判定。分类完成后,在同类型问句中计算问句之间的相似度,这里使用的是余弦定理进行相似度的计算。相似度的计算是建立在词语的基础上,所以首先要对问句进行分词处理,本文使用的是IKAnalyzer分词器。本文还使用了TF-IDF技术对本领域的关键词进行提取,使问答系统更有针对性。 经过多次测试,本系统基本符合问答的需求。通过计算用户问句和题库中问句的相似度,返回相似度最高的问句答案给用户。如果题库中没有用户所要的答案,即返回的答案不能令用户满意,则用户可以将问题发到公共讨论区以便其他用户对该问题进行回答。最后将审核通过的问题答案对添加到FAQ库中。随着使用的时间越长,题库中的问句越丰富,本系统返回给用户的答案也就越准确。 【关键词】:智能问答; 中文分词; 中文问句分类; 语义相似度计算; TF-IDF
目录 摘要 Abstract 第一章 绪 论-1 1.1 研究背景-1 1.2 研究现状-1 1.3 本文研究内容-2 第二章 相关技术和理论介绍-3 2.1 jQuery EasyUI简介-3 2.2 MySQL简介-3 2.3 Hibernate简介-3 2.4 Struts2简介-4 2.5 中文分词简介-4 2.6 TF-IDF简介-5 2.7 SVM简介-5 第三章 系统设计-7 3.1 系统架构设计-7 3.1.1 FAQ问句管理设计-7 3.1.2 公共区问句管理设计-7 3.1.3 智能答疑模块设计-8 3.1.4 公共问答区设计-9 3.2 数据库设计-9 3.2.1 用户信息表-9 3.2.2 用户角色信息表-9 3.2.3 问句类别表-9 3.2.4 问句信息表-10 3.2.5 用户提问表-10 3.2.6 用户回答表-10 3.2.7 学科表-11 第四章 关键技术的具体实现-12 4.1 根据TF-IDF提取关键词-12 4.2 利用LibSVM判断学科类别-14 4.3 根据余弦定理计算问句相似度-18 第五章 系统功能的实现展示-21 5.1 开发环境与工具-21 5.2 FAQ库管理的实现-21 5.2.1 计算机基础课程关键词典的创建-21 5.2.2 FAQ库的创建-22 5.3 基于模式匹配的问句分类-23 5.4 智能答疑区的实现-24 5.5 公共问答区的实现-26 5.6 公共区问句管理的实现-28 5.7 后台其它管理的实现-29 第五章 系统总结与展望-31 参 考 文 献-32 致 谢-33 |