基于SVM的药物靶点预测方法及其应用

来源 :现代生物医学进展 | 被引量 : 0次 | 上传用户:olived0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:基于已知药物靶点和潜在药物靶点蛋白的一级结构相似性,结合SVM技术研究新的有效的药物靶点预测方法。方法:构造训练样本集,提取蛋白质序列的一级结构特征,进行数据预处理,选择最优核函数,优化参数并进行特征选择,训练最优预测模型,检验模型的预测效果。以G蛋白偶联受体家族的蛋白质为预测集,应用建立的最优分类模型对其进行潜在药物靶点挖掘。结果:基于SVM所建立的最优分类模型预测的平均准确率为81.03%。应用最优分类器对构造的G蛋白预测集进行预测,结果发现预测排位在前20的蛋白质中有多个与疾病相关。特别的,其中有两个G蛋白在治疗靶点数据库(TTD)中显示已作为临床试验的药物靶点。结论:基于SVM和蛋白质序列特征的药物靶点预测方法是有效的,应用该方法预测出的潜在药物靶点能够为发现新的药靶提供参考。 OBJECTIVE: To study new and effective drug target prediction methods based on the primary structural similarities of known drug targets and potential drug target proteins in combination with SVM. Methods: Constructing the training sample set, extracting the primary structure features of protein sequence, preprocessing the data, selecting the optimal kernel function, optimizing the parameters and selecting the features, training the optimal prediction model to test the predictive effect of the model. The G protein coupled receptor family of proteins as a predictive set, the establishment of the optimal classification model for its potential drug targets mining. Results: The average accuracy rate of the best classification model based on SVM was 81.03%. The optimal classifier was used to predict the predicted set of G proteins and found that there were multiple disease-related predictions in the top 20 proteins. In particular, two of these G proteins have been shown in therapeutic target databases (TTDs) as drug targets for clinical trials. Conclusion: The drug target prediction method based on SVM and protein sequence characteristics is effective. The potential drug targets predicted by this method can provide a reference for the discovery of new drug targets.
其他文献
农业机械化在农业生产中历来受到重视,作为一名基层农机工作者,笔者认为建立新型农机合作社对我县农业发展、农民增收、农业产业化调整和社会主义新农村建设都具有十分重要的意
一、育苗床准备盛夏初秋天气或高温多雨或高温干旱,光照变化剧烈,病虫害发生严重。夏天气温往往超过甜瓜生长的适宜温度,加之在保护地育苗,如果通风降温设施跟不上,苗床的温度还要
农业机械化信息是连结农民与市场的桥梁,是市场经济条件下广大农户和经济主体实现决策优化的必要条件。信息化是当今世界经济和社会发展的大趋势,也是实现农业现代化的必然要求
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
复合材料缝合技术是指采用缝合线使多层织物结合成准三维立体织物或使分离的数片织物连接成整体结构的一种复合材料预制体制备技术。该技术起源于20世纪中后期,由于其可以提高
Photoshop是应用最为广泛的图像处理软件,其凭借优越的性能以及不断地进行研发更新,深受广大用户的喜爱。Photoshop主要应用于室内设计、网页设计、广告设计以及照片处理等领