您的位置: turnitin查重官网> 工程 >> 电气工程 >> 电气工程及自动化 >对于蛋白质基于集成神经网络蛋白质相互作用

对于蛋白质基于集成神经网络蛋白质相互作用

收藏本文 2024-04-09 点赞:29520 浏览:133303 作者:网友投稿原创标记本站原创

摘要:蛋白质相互作用在新陈代谢、信号传导与识别、细胞周期调整、复杂蛋白复合物的形成、癌症发生等方面都发挥着至关重要的作用。由此,探讨蛋白质间的相互作用不仅有助于全面了解生命历程,而且对于发病机制的探讨、新药物的研发和寻找药物靶标等方面都具有重要作用。当前随着高通量实验技术的进展,大量的蛋白质序列信息被测出,如何以海量的蛋白质序列信息中判定哪些蛋白质间是发生相互作用的,哪些是不会发生相互作用的,相互作用的蛋白质作用位点在哪些氨基酸残基上等都是目前亟待突破的不足。由于蛋白质相互作用网络十分复杂,同时相互作用的数据呈现规模大、噪声高等特点,这给生物信息学的探讨带来了前所未有的挑战。本论文以蛋白质一级序列信息出发,利用智能算法,对蛋白质间的相互作用进行预测探讨,所做的主要工作和革新点有以下几个方面:(1)在蛋白质相互作用位点预测方面,提出了基于组合特点集成的预测策略。蛋白质相互作用位点预测的探讨对象是单个的氨基酸残基,通过提取氨基酸残基的某些生物特点来判定其是否是相互作用位点是直接有效的方式。本论文中在提取了蛋白质氨基酸残基的序列谱信息、熵值和溶剂可及表面积三种特点的基础上,对其进行了不同方式组合,组成了四组样本集,分别用四组样本集训练基本RBF神经网络分类器,最后采取GASEN集成策略对四种基本本分类器进行集成学习。实验结果表明不同的特点组合方式对分类器预测结果有影响,在氨基酸基本特点序列普的基础上增加溶剂可及表面积比增加熵值对分类器预测精度的提升更有效。同时利用不同特点组合样本集训练的基本分类器在训练集上就增大了基本分类器间的结构差别性,以这种方式进行最后的集成使预测精度由只有序列谱输入时候的66.79%大幅度上升到了81.37%,证明这种基于组合特点集成的预测策略是有效的。(2)在蛋白质-蛋白质相互作用预测方面主要进行了基于不同编码方式的BP神经网络集成和基于不同负样本集的RBF神经网络集成的预测方式。针对不同的蛋白质对编码方式不同可导致不同的预测结果,文中主要创建了三种不同编码方式的样本集,分别是向量加、向量减和直接连接的编码方式,通过比较证明直接相连的编码方式效果最好。基于不同编码方式训练的基本分类器用GASEN集成策略进行集成,结果表明这种方式的集成也能较大幅度的提升预测精度。(3)针对当前在蛋白质-蛋白质相互作用探讨中没有标准的非相互作用集的近况,利用不同的策略创建了四组蛋白质非相互作用样本集即负样本集,在四组不同的样本集上分别进行RBF神经网络学习,结果表明在生物体内,距离越远的负样本集预测效果越好,为生物学家构建蛋白质非相互作用数据集指明了方向。同时这种利用不同负样本集训练基本分类器来集成的方式也是有效的,因为这种训练方式也增加了基本分类器的异构性。根据以上实验可以看出,利用不同的方式增加集成分类器的异构性都可以提升集成分类器的预测能力。关键词:蛋白质相互作用位点论文蛋白质-蛋白质相互作用论文特点论文神经网络论文集成论文

    摘要8-10

    Abstract10-12

    第一章 绪论12-20

    1.1 引言12-13

    1.2 目前国内外探讨进展13-16

    1.2.1 生物实验策略13-15

    1.2.2 计算生物学策略15-16

    1.3 蛋白质相互作用的探讨作用16-17

    1.4 本论文探讨进度安排17-20

    第二章 相关论述知识及数据库介绍20-32

    2.1 蛋白质相关知识20-25

    2.1.1 氨基酸20-21

    2.1.2 蛋白质的结构21-25

    2.2 生物学相关数据库介绍25-28

    2.2.1 GenBank 数据库25-26

    2.2.2 PDB 数据库26-27

    2.2.3 DIP 数据库27

    2.2.4 DSSP 数据库27-28

    2.3 蛋白质相互作用预测的计算策略28-31

    2.3.1 预测蛋白质相互作用位点的策略28-29

    2.3.2 预测蛋白质-蛋白质间相互作用的策略29-31

    2.4 本章小结31-32

    第三章 神经网络与集成学习32-46

    3.1 BP 神经网络33-34

    3.2 RBF 神经网络34-35

    3.3 神经网络的集成35-38

    3.3.1 构造基本分类器的策略36-37

    3.3.2 基本分类器的集成策略37-38

    3.4 集成神经网络中各参数的优化38-43

    3.4.1 GA 优化集成神经网络的策略介绍38-41

    3.4.2 PSO 优化集成神经网络的策略介绍41-43

    3.4.3 GA 与 PSO 浅析比价43

    3.5 本章小结43-46

    第四章 基于组合特点集成的蛋白质相互作用位点预测46-54

    4.1 数据来源46-47

    4.2 特点提取47-48

    4.3 蛋白质相互作用界面残基的定义48-49

    4.4 样本集创建49-50

    4.5 RBF 集成神经网络构建50-51

    4.6 实验结果浅析51-53

    4.6.1 系统评价参数51-52

    4.6.2 预测结果及浅析52-53

    4.7 本章小结53-54

    第五章 基于集成神经网络的蛋白质-蛋白质间相互作用预测54-70

    5.1 数据来源54-55

    5.2 N 间隔二联体特点提取法55-57

    5.3 蛋白质-蛋白质相互作用的编码方式探讨57-59

    5.3.1 向量加法编码58

    5.3.2 向量减法编码58

    5.3.3 核函数编码58-59

    5.3.4 直接串联编码59

    5.4 基于 BP 神经网络集成的蛋白质-蛋白质相互作用预测59-64

    5.4.1 样本集创建59-60

    5.4.2 BP 集成神经网络构建60-61

    5.4.3 实验结果浅析61-64

    5.5 基于 RBF 神经网络集成的蛋白质-蛋白质相互作用预测64-68

    5.5.1 样本集创建64

    5.5.2 RBF 神经网络构建64-66

    5.5.3 实验结果浅析66-68

    5.6 本章小结68-70

    第六章 总结与展望70-74

    6.1 本论文主要探讨成果革新70-71

    6.2 探讨不足与展望71-74

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号