【摘 要】
:
经验风险最小化(ERM)算法是统计学习理论中的一个经典的学习算法.它在学习理论中具有非常重要的地位,能够解决学习中的一些传统问题,比如,回归估计问题中的最小二乘法,概率密
论文部分内容阅读
经验风险最小化(ERM)算法是统计学习理论中的一个经典的学习算法.它在学习理论中具有非常重要的地位,能够解决学习中的一些传统问题,比如,回归估计问题中的最小二乘法,概率密度估计的极大似然法等.因此,对ERM算法的研究就显得尤为重要.到目前为止,对ERM算法的研究主要有研究其算法的一致性和算法的收敛速率等问题.但是,对ERM算法的一致性和收敛速率的研究几乎都是基于数据是来自一个独立同分布样本的假设之上.然而,我们知道独立同分布的假设是过于严格的,在现实生活中验证一个样本的独立性并不是一件容易的事情.此外,在一些实际问题中,比如,DNA序列分析,市场预测,网页搜索等等,样本并不是独立同分布的.因此,我们有必要研究ERM原则在非独立样本上的一致性和学习速率的表现.本文将在指数强混合样本和一致遍历马氏链的情况下讨论ERM原则的一致性.在讨论基于指数强混合序列的经验风险最小化算法的一致性时,我们首先利用指数不等式建立了经验风险最小化算法的收敛界.然后我们研究经验风险和期望风险的偏差.与其他研究者建立的经验风险与期望风险的一致偏差不同,我们考虑的是两者的相对一致偏差,这样就能有效的反映出当期望风险取最小值时,对应着经验风险与期望风险之间的偏差以很大的概率取得最小值.于此同时,我们也得到了更小的置信区间.ERM算法在面对临所给函数集复杂性很高时,该算法将会非常耗时并且会发生过拟合的现象.本文将基于指数强混合样本解决ERM原则的耗时问题.与其他研究者常用的正则化技巧不同,这里我们将采用了一种全新的方法.这种方法的思想在于把函数集有技巧地进行分解,来降低函数集的复杂性,从而解决耗时问题.一致遍历马氏链是比指数强混合更弱的一种非独立样本.它在统计学,排队论和信号处理等问题中有着广泛的应用.在探究基于一致遍历马氏链的ERM算法的一致性问题时,同指数强混合情形一样,都是利用指数不等式建立经验风险最小化算法相对一致收敛的界.但在获得界的方法上,却与其他研究者不同.我们采用了给其分母多增加一项的方法,使得相对偏差中分母的非零性得到了保证.同时改进后的相对一致偏差更能反映经验数据的本质.因为方法的改进,与基于指数强混合样本或其他对马氏链的研究成果相比,我们得到的收敛速率更快了.
其他文献
车辙是沥青路面特有的主要变形破坏之一。雨天的积水车辙路段,不但使行车制动距离加长,而且会造成短时间内出现大幅度侧偏,加剧行车风险。为在管养过程中有效控制积水车辙行车安全,降低雨天车辆驶过车辙路段发生事故的风险,需全面了解车辙的三维形态对路面积水分布产生的影响。目前对车辙检测评价中,仅用最大深度描述车辙的严重程度,无法获取车辙的三维形貌,更无法描述车辙三维形貌的变化对路面积水分布的影响;且利用单一的
辽宁省是我国传统工业基地之一,是典型的资源型发展省份。资源型城市在我国工业化进程中做出了巨大贡献,却也因为资源枯竭引发了城市不同程度的发展缓慢乃至衰退,还引发了经
CBA是我国男子篮球运动的最高水平联赛,随着社会关注程度和比赛强度及激烈程度日益上升,教练员和篮球运动员对比赛的胜利也越来越渴望,通过分析球队的攻防能力可以很好的提升球队整体水平。广东省是CBA联赛中参赛队伍最多的省份,包括广东东莞银行、深圳马可波罗和时代中国广州。除广东队重新登顶冠军宝座外,其余两支队伍都有很大的提升空间,他们需要了解如何长久保证自身优势之外,还要找出自身不足,利用科学定量的分析
细胞自噬是一种真核生物中非常保守的细胞内物质降解机制,通常是指细胞受到信号诱导后,在胞内从头合成双层膜包裹胞质的自噬体,与溶酶体或液泡融合,进而降解其所包含的内容物
当前对教育价值取向的研究有很多,但无论是为推动社会进步,还是为促进个人发展,教育都发挥着一种工具性的效用价值,这是一种对教育相关价值的追求,它在教育目的、实践过程和
微生物次级代谢产物不仅结构类型多样,而且具有多种生物活性,其中一些代谢产物已经被人类开发应用,在人类生产生活中起着重要作用。本研究对三株菌株Stereum sp.ATCC64657、I
中国已经编制并完成实施了十二个五年规划(计划),中国经济总量达到60万亿元,成为世界第二大经济体,中国前十一个五年计划的计划增长率平均为10.8%,实际增长率为8.1%(鄢一龙,2
三维重建技术的发展有效地降低了三维网格曲面模型的获取成本,促进了其在各个领域中的应用。而三维网格曲面去噪一般是三维重建过程中最为基础与重要的一步。因此,关于三维网
数据挖掘已经成为大数据时代下数据处理、文本分类、数据研究不可或缺的一项标准工具。通常,为了实现数据挖掘的目标,必须配合数据爬取、数据存储、数据分析等各种手段。然而
相变蓄冷空调系统利用相变材料在夜间蓄冷、白天释冷,以达到移峰填谷、平衡电价的目的。与冰蓄冷空调系统相比,相变蓄冷空调系统有着更高的蒸发温度,冷水机组的运行效率也更高,并且相变蓄冷空调系统不需要配备专门的夜间蓄冷冷水机组,常规冷水机组即可解决夜间蓄冷、白天供冷的问题。与水蓄冷空调系统相比,相变材料的相变密度比水大,蓄冷槽的占地面积比水蓄冷要小。本文利用Fluent数值模拟软件,建立了单个蓄冷柱的相变