主成分分析在蛋白质结构类预测中的应用研究.docx

资料分类:理工论文 上传会员:翩翩起舞 更新时间:2022-05-13
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:9192
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:生物信息学是一门最近几十年快速发展起来的学科,其主要是应用数学、统计学、计算机和信息学等方法研究和生物相关的一系列问题,并且研究从分子生物数据中挖掘信息的理论和方法。蛋白质结构类预测在生物信息学中有着重要的研究地位。一般来说,影响蛋白质结构类预测的准确程度有两个方面:一方面,蛋白质序列特征提取和选择方法;另一方面,分类算法的选择。

本文主要从蛋白质二级结构序列和简化的蛋白质二级结构序列中提取特征信息,通过主成分分析进行降维,然后利用杰克刀方法通过支持向量机进行检验。针对三组数据(25PDB,D1189和640)我们分别计算了敏感性,特异性,总精确度和相关系数,通过与经典方法的比较,说明我们提取的方法是有效的。

 

关键词:蛋白质结构类预测;杰克刀检验;支持向量机

 

目录

摘要

Abstract

1生物信息学简介-1

1.1基本概念介绍-1

1.2生物信息学研究内容-1

1.2.1前基因组阶段-1

1.2.2 基因组阶段-2

1.2.3 后基因组阶段-2

2 蛋白质结构类预测研究-3

2.1 数据集-3

2.2研究步骤-4

2.2.1信息提取与选择-4

2.2.2分类算法-4

3基于主成分分析的蛋白质结构类信息提取方法研究-7

3.1 主成分分析介绍-7

3.2 支持向量机介绍-7

3.3特征提取-9

3.4杰克刀检验与算法评估-10

3.5结果分析-11

结    论-14

参 考 文 献-15

致    谢-16

相关论文资料:
最新评论
上传会员 翩翩起舞 对本文的描述:此外,利用生物信息学还可以研究人类复杂疾病的发生机理,分析在疾病的发生过程中遗传、环境因素以及它们互相作用产生的影响。运用生物信息学可以对个体患有某些重大疾病的风......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: