基于深度学习的配体分子海量特征筛选及回归方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:true51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征筛选和深度学习是机器学习的重要分支。现如今各种结构和不同规模的数据充斥我们生活的方方面面。我们希望有效地提取数据中的模式并且能够建立高预测精度的可解释模型。而识别重要的可解释性特征的一项流行技术就是特征筛选。近来由于在各种机器学习任务中取得了巨大的成功,深度学习获得了大量研究者的关注。深度学习的一个重要特点就是提取特征。通过挖掘数据集中的关系,可以更准确的找到特征;通过增加层数来增加网络的复杂性,可以从数据中提取更高层次的特征,或者是与结构关联更少的特征,或者是更多与数据内容相关的特征。本文的主要贡献如下:(1)提出基于加强对偶多面体LASSO方法的配体分子海量特征筛选方法,大幅加速配体海量特征筛选过程,去除大部分无关的特征,使得后续学习仅需在小部分特征上进行,大幅提高了模型的学习效率。实验结果验证了我们算法的有效性。(2)提出了一种全新的基于加权深度学习和随机森林的GPCR相关配体分子活性的预测算法WDL-RF,它包括基于新型加权深度学习的分子指纹生成阶段和基于随机森林模型的生物活性预测两个阶段。该方法的特点在于,它是一个端到端的预测学习框架。实验结果显示,在所有数据集及模型评价指标上,我们算法的性能都是最好的。
其他文献
体育游戏作为一种综合性的体育活动,是学校体育教育过程中的一种行之有效的手段和方式。总体上,体育游戏具有促进对运动技能的提高;培养优良习惯的形成;促进身心全面发展三大
市政路桥工程建设的目的是为人民服务,其质量直接影响了它的价值发挥。施工是市政路桥工程建设的关键,具有很强的科学性、系统性。在具体的市政路桥施工实践过程中,施工单位
在民间舞蹈教学中,藏族舞蹈因为训练价值和意义重大,因此有着十分重要的地位。总体来说,藏族舞蹈对动作的灵巧性要求严格,另外起舞时宗教韵味浓厚,美感十足,所以一般来说藏族
当事人的陈述是法院居中裁判、处理纠纷的重要依据。当事人作真实的陈述,可以节省法院查明案件事实的时间,促进案件高效的审理以及作出公正的裁判。反之,就容易导致法官对相关案件事实产生错误的判断,影响诉讼程序的有效开展,最终影响司法权威。本文主要分为三章。第一章主要对当事人虚假陈述的含义、表现、以及规制的理论基础进行阐述。当事人虚假陈述是指在民事诉讼过程中当事人对案件事实的一种不诚实的陈述行为,本文所探讨
<正>品德与生活是一门理论与实践、知与行紧密结合的学科。我们需要在新课程理念的指导下,突破传统的教学模式,开放教学内容、放评价形式,通过学生的自我发现、自我认识、自
随着国家经济发展,社会进步,路桥施工项目逐年增长。工程质量是建筑工程的关键与核心,是保证建筑工程使用年限的有效手段。目前,随着科学技术的发展,路桥施工技术得到优化,钢
为研究原发性肾病综合征时大量蛋白尿和低白蛋白血症与脂质代谢异常之间的关系,检测20例住院原发性肾病综合征病人24h尿蛋白排泄量、血白蛋白浓度、血总胆固醇及低密度脂蛋白
<正>本书汲取传统理趣精华,根植传统教学智慧,立足课堂教学实践,详细系统地阐述了如何构建现代语文理趣课堂。作者把理论和实践相融合,以丰富、典型的课例,直观地阐述了建构
情境教学是一种符合小学生英语学习的教学方式。它符合小学生的年龄特点、心理特征和认知水平,能使抽象的语言生动化、形象化。本文主要就小学英语课堂教学中创设趣味教学情
本文提出了一种对于运用加玻纤低光泽材料通过注塑制造低光泽仪表板的工艺改进方法。针对由于低光泽加玻纤材料流速低、硬度大的特点所导致的注塑过程中表面质量差、模具寿命