需要金币:1000 个金币 | 资料包括:完整论文 | ||
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:9192 | ||
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:生物信息学是一门最近几十年快速发展起来的学科,其主要是应用数学、统计学、计算机和信息学等方法研究和生物相关的一系列问题,并且研究从分子生物数据中挖掘信息的理论和方法。蛋白质结构类预测在生物信息学中有着重要的研究地位。一般来说,影响蛋白质结构类预测的准确程度有两个方面:一方面,蛋白质序列特征提取和选择方法;另一方面,分类算法的选择。 本文主要从蛋白质二级结构序列和简化的蛋白质二级结构序列中提取特征信息,通过主成分分析进行降维,然后利用杰克刀方法通过支持向量机进行检验。针对三组数据(25PDB,D1189和640)我们分别计算了敏感性,特异性,总精确度和相关系数,通过与经典方法的比较,说明我们提取的方法是有效的。
关键词:蛋白质结构类预测;杰克刀检验;支持向量机
目录 摘要 Abstract 1生物信息学简介-1 1.1基本概念介绍-1 1.2生物信息学研究内容-1 1.2.1前基因组阶段-1 1.2.2 基因组阶段-2 1.2.3 后基因组阶段-2 2 蛋白质结构类预测研究-3 2.1 数据集-3 2.2研究步骤-4 2.2.1信息提取与选择-4 2.2.2分类算法-4 3基于主成分分析的蛋白质结构类信息提取方法研究-7 3.1 主成分分析介绍-7 3.2 支持向量机介绍-7 3.3特征提取-9 3.4杰克刀检验与算法评估-10 3.5结果分析-11 结 论-14 参 考 文 献-15 致 谢-16 |