【摘 要】
:
图模型能清楚地表示变量间的结构关系,被广泛的应用于机器学习、因果推断、生物信息学等各个领域。图模型中的贝叶斯网是一个有向无环的模型,能够更直观的描述变量间的依赖关系,特别是在其中引入潜变量后,不仅可表示因果推断中不可观测的混杂,而且可简化模型降低模型的复杂度,还可以提高计算的效率。然而,如何确定潜变量的个数、潜变量取值空间以及变量之间结构依赖关系,获得与数据拟合最好的模型,是一个非常具有挑战性的问
论文部分内容阅读
图模型能清楚地表示变量间的结构关系,被广泛的应用于机器学习、因果推断、生物信息学等各个领域。图模型中的贝叶斯网是一个有向无环的模型,能够更直观的描述变量间的依赖关系,特别是在其中引入潜变量后,不仅可表示因果推断中不可观测的混杂,而且可简化模型降低模型的复杂度,还可以提高计算的效率。然而,如何确定潜变量的个数、潜变量取值空间以及变量之间结构依赖关系,获得与数据拟合最好的模型,是一个非常具有挑战性的问题。这一问题在机器学习领域称为结构学习,本质上是统计学中的模型选择问题。本文针对含潜变量的贝叶斯网的结构学习问题,给出了基于惩罚似然的方法。这里的惩罚包括两项。一是对于可观测变量间的系数进行1l范数惩罚,以获得稀疏的模型;二是采用核范数(本文中为矩阵的迹)惩罚,以控制潜变量的个数。我们采用交替凸搜索方法,结合ADMM算法和坐标轴下降法,最小化惩罚似然,从而获得观测变量间的结构关系和潜变量个数的估计。我们给出了详细推导过程,编写了R程序,与当前主流的PC算法、RFCI算法、Adaptive Lasso惩罚似然方法、低秩稀疏(lrps)方法、低秩稀疏+贪婪搜索(lrps+ges)方法进行了比较。通过大量的模拟,我们发现当样本量大于200时,我们的方法有较好的表现。
其他文献
本文结合现有文献中的方法和自身思考构建了地缘关系指标体系,利用Google的GDELT数据库,探索地缘关系对中国出口贸易增长的作用。本文发现地缘关系在短期和长期维度上对国家
体育教学评价教育就是对体育学习者在接受评价前,所进行的关于评价系统的认知、方法、态度与情感方面的指导活动。研究从体育教学评价发展的"钟摆现象"、实然与应然的反思中
奔豚证(也称奔豚气病)是中医特有的病名,《金匮要略》对奔豚证的病因病机有具体论述,并提出详细的辨证施治,后世医家多有论述,临床上也不乏少见。国家级名老中医高益民教授临
目的:观察抗抑郁药物合并奥氮平治疗伴躯体疼痛抑郁症临床疗效及其不良反应。方法:选取伴有躯体疼痛症状抑郁症患者80例,将其分为实验组(抗抑郁药合奥氮平治疗)和对照组(抗抑
航空业面临着需要权衡成本与不断变化的业务需求、客户需求和安全标准这一复杂而严峻的挑战。在自动化进程中,新技术的采用越来越多,这提高了效率并增强了客户体验,也在无意
对王光鼎教授治疗面瘫的临床经验进行总结,认为面瘫主要为"风"、"瘀"致病,临床上运用中西结合、针药并用对其进行治疗,疗效显著。
我国民族声乐演唱的基本原则就是“字正腔圆”“声情并茂”,这也是一直被音乐界所认可及接受的,那么民族声乐演唱的原则也是所有从事民族声乐教育、演唱者所追求的目标。随着我
目的探讨透明质酸(HA)及其相关蛋白(SHAP-HA)等血清学指标在肝纤维化、肝硬化及所继发的原发性肝癌演变过程中的作用。方法应用酶联免疫法观察HA及其相关蛋白等血清学指标,并
在《判断力批判》中,康德对审美判断进行了重点分析,提出了审美判断四契机说。康德在前人的经验上对这些观点进行集中和概括,从哲学的高度上重新赋予它们先验的性质。
裁判要旨:对于保险人行使代位求偿权的诉讼,法院应当仅就造成保险事故的第三人与被保险人之间的法律关系进行审理,不应实质性审查保险合同关系。海上运输中货物毁损的风险何