论文部分内容阅读
为了探究微小RNA(miRNA)在肝损伤早期诊断中的可行性、有效性,本研究将机器学习方法与miRNA标志物结合应用于区分肝癌及乙肝病毒感染者与健康人群。本研究主要分为两部分工作,第一部分通过文献阅读,对肝损伤引起的具有显著水平变化的miRNA变化进行了生物标志物淘选,得到了13种候选miRNA,分别是:miR-21、mi R-203a、miR-214、miR-205、miR-451、miR-126、miR-192、miR-200a、miR-221、miR-122、miR-16、miR-195、miR-206。第二部分通过三批数据收集,最终确定了6种miRNA,分别是miR-200a、miR-221、miR-122、miR-16、miR-195、mi R-206作为最终的生物标志物,并验证了这6种miRNA在机器学习分类中的分类效果。其中通过第一批和第二批数据的机器学习方法处理,我们将13种miRNA中组合表现最好的6种miRNA作为第三批数据收集的参考,第三批数据的机器学习处理结果所得到的结果进一步验证了这6种miRNAs选择的有效性。本研究使用了4种机器学习分类方法,分别是决策树算法TREE-J48、逻辑回归算法Logistic、贝叶斯算法Bayes net和Na?ve bayes及支持向量机LIBSVM。其中,预测性能最佳的是通过TREE-48建立的预测模型。