需要金币:2000 个金币 | 资料包括:完整论文 | ||
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:10689 | ||
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:教育是国家的根本,自人类社会形成教育开始,专家学者们就不断地研究新技术,探索技术可能带给教育领域的变革。近年来,人工智能技术的应用成为了各行各业的研究热点。机器学习是人工智能的核心,是使计算机具有智能的根本途径。深度学习是机器学习领域下的研究分支,它可以使机器在原有的基础上更加智能。在当今这个信息化时代,随着科技的快速进步与人工智能的迅猛发展,深度学习技术已经应用到了越来越多的行业和领域,如医学、工业、农业等,当然也包括教育。深度学习在自然语言处理方面有着十分出色的应用。本研究基于向量级别的文本匹配技术,致力于构建双向的长短期记忆循环神经网络模型,使计算机可以对数学习题进行自动分类。本研究收集了870条数学习题作为基础语料,将其中的特征词语组成了一个用户字典,利用Python的Jieba库对语料进行了分词处理、使用Gensim库将语料转换成词向量。习题经过分词、构建词向量模型等预处理,进入双向长短期记忆循环神经网络中迭代训练,从而得到有判断能力的神经网络系统。
关键词:深度学习;自然语言处理;词向量;神经网络;题型分类
目录 摘要 Abstract 引 言-1 (一)-研究背景及意义-1 (二)-国内外研究现状-1 (三)-本文的组织架构-2 一、相关理论与技术-3 (一)-自然语言处理-3 1.自然语言处理-3 2. 词向量-4 (二)-循环神经网络-4 1. 循环神经网络-4 2. 双向的长短期记忆循环神经网络-5 (三)-程序设计中的第三方库-5 1.Jieba-5 2.Gensim-5 3.PyTorch-6 二、数学习题自动识别系统的研究与设计-6 (一)-研究分析-6 1.数学习题类型的分析-6 2.研究的可行性分析-7 (二)-系统总体设计-7 (三)-深度学习的框架选择-8 三、数学习题语料的收集与预处理-8 (一)-语料的收集与整理-8 1.语料的收集-8 2.语料的分类-9 (二)-文本清理-9 (三)-构建用户字典-10 (四)-语料分词-10 四、数学习题自动识别系统的构建与代码实现-10 (一)-程序运行-10 1.测试环境Python及第三方库的版本-10 2. 构建词向量模块的实现-11 3. 基于BiLSTM的习题类型的自动分类模块的实现-12 (二)-程序训练结果与结果说明-16 五、总结与展望-17 (一)-本文的主要研究成果-17 (二)-本文的不足与展望-17 1.本文的不足之处-17 2.本文的展望与未来可能有的发展-18 结 论-18 参考文献-18 |