蛋白质结构类预测方法研究.docx

资料分类:理工论文 上传会员:天使的翅膀 更新时间:2019-04-08
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:10709
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:由于生物学研究的飞速进展,生物信息学等实现不同领域的多个应用程序,现在它已应用于生物,数学,物理等领域。生物信息学是一个有体系的科学,生物和生物信息学及相关内容是我们需要第一项去研究的。今天的生物学不限于观察和实验,理论和计算方面也将在它的领域中发挥了巨大的作用。本课题的主要任务对蛋白质结构预测方法进行了研究。

    我们通过支持向量机对蛋白质结构类进行预测,并采用了11个特征,其中,本文提出了基于蛋白质二级结构序列中E,H和C间隔序列的偏度的3个特征,其余8个特征是以前研究者提出的。本文基于支持向量机,通过杰克刀检验,对25PDB、1189和640三组数据集来训练和测试我们的方法,三组数据的总精确度均在80%以上,说明我们的的方法是有效的。 

 

关键词:生物信息学;支持向量机;间隔序列偏度

 

目录

摘要

Abstract

1.生物信息学的简介-1

1.1 生物信息学的背景和定义-1

1.2 生物信息学研究对象-2

1.2.1 核酸-2

1.2.2蛋白质-3

1.3生物信息学的研究内容-5

1.3.1序列比较-5

1.3.2蛋白质结构的比较和预测-5

1.3.3基因表达数据分析-5

2 蛋白质结构类预测-7

2.1 研究背景-7

2.2蛋白质的二级结构-8

2.2.1蛋白质二级结构的形式-8

2.3预测方法-9

2.3.1同源性(Homology)方法-9

2.3.2统计/经验算法─ Chou-Fasman和GOR方法-9

2.3.4物理化学方法-10

3 用支持向量机预测蛋白质结构类-11

3.1蛋白质结构数据集-11

3.2蛋白质结构特征的提取-11

3.3支持向量机-13

3.4 刀切法检验与算法性能评估-16

3.5偏态系数、偏度、标准(变异)系数-16

3.5.1偏态系数-16

3.5.2偏度-17

3.5.3标准(变异)系数-17

3.6间隔序列-18

3.7 我们的预测结果-18

结    论-21

参考文献-22

致    谢-24

相关论文资料:
最新评论
上传会员 天使的翅膀 对本文的描述:有一种概念叫作计算生物的分子学,该概念与信息生物知识有关联,也叫作计算生物学,它们很是相似所以一般不区分。生物信息学使用计算机和网络的功能,从数学和信息科学两方面......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: