论文部分内容阅读
在系统水平控制下,蛋白水解的调节在各种重要的细胞过程(如血液凝固、细胞增殖和细胞凋亡等)中起关键作用。确认和识别蛋白酶的真实底物蛋白是我们更好地理解这一过程的机制的关键所在。为了解决这个问题,基于之前开发的PROSPER工具,我们开发了PROSPER2.0,用于准确预测蛋白酶底物特异性及其切割位点。PROSPER 2.0旨在为蛋白质裂解位点预测覆盖更多的蛋白酶(多达38种蛋白酶)以及提供更好的预测性能。PROSPER 2.0在框架结构上整合了来自多个级别的异构的序列以及结构的特征,同时结合了两层的特征选择方法。交叉验证和独立测试的结果表明,PROSPER 2.0能够实现比现有通用工具更具竞争力的性能,并将促进假设驱动的新型底物发现。针对基质金属蛋白酶(MMP)的六种蛋白酶数据集,我们提出了基于知识迁移的计算框架,通过迁移其他MMPs的隐含的有用信息来增强底物裂解位点预测的性能。该框架使用支持向量机结合迁移学习的思想和特征选择的方法实现。结果表明该方法和传统的特征选择方法相比,在六个数据集上各有其优势,为MMP底物裂解位点的预测提供了有用的新的思路。