【摘 要】
:
多示例学习(Multiple-Instance Learning)不同于传统的监督学习,在文本分类,图像处理(自然场景分类,基于内容的图像恢复等)等领域,MIL都得到了大量的应用。为了解决各种各样
论文部分内容阅读
多示例学习(Multiple-Instance Learning)不同于传统的监督学习,在文本分类,图像处理(自然场景分类,基于内容的图像恢复等)等领域,MIL都得到了大量的应用。为了解决各种各样的MIL问题,近些年来研究者们提出了多种算法,其中经典的嵌入空间算法MILES首先利用特征映射来构造包级特征,再利用支持向量机SVM来训练一个标准的监督学习分类器。MILES算法主要分为特征映射和特征选择,以及标准的分类器构造几个部分。很多经典数据集上的实验结果表明,该算法的分类精度较高。然而由于前期较为庞大的数据处理量,导致MILES的计算复杂度较高,整个算法的运行时间较长,另外MILES的抗噪性能也需要改善。因此,本文利用MILES的思路对其作出改进,主要内容如下:(1)对MILES算法和其它常见典型算法进行分析。重点分析了其中的几种典型算法,比如DD,DD-SVM,MILES等等。其中MILES算法将MIL问题转化为已有的监督学习问题,利用训练集中的所有单示例,构造一个特征空间。紧接着对其做特征选择,最后利用选择好的特征向量,训练出一个标准的分类器。本文将会分析MILES的整体思路,以及其中的特征映射和特征选择两个关键问题及标准的分类器构造等。接着结合实验结果分析得出MILES算法的不足之处,为后文提出改进算法作出铺垫。(2)针对MILES算法计算复杂度较高,抗噪性能也不够好的不足,本文提出了一种基于聚类和概率神经网络的改进算法MIL-CPNN(Multiple-Instance Learning via Probabilistic Neural Network based on Clustering)。改进算法同样采用MILES的总体思路,即先获取包级特征再构造分类器。为了避免大量的运算,先通过聚类来得到包级特征,紧接着利用概率神经网络的的高效性,将包级特征送入其中训练来构造分类器。通过实验结果对比表明,该算法有较好的抗噪性能,能比较有效的降低运行时间,也有着不错的分类精度。(3)为了进一步提高MILES算法的分类精度,同时减小MILES中的嵌入过程的计算量,本文还提出了另一种基于神经网络形式的MIL算法。由于包含了嵌入过程,同时又结合了神经网络,所以将其命名为MIL-ENN(Multiple-Instance Learning via Embedding and Neural Network)。通过实验结果对比表明,该算法能够一定程度的提高分类精度,同时由于嵌入空间运算量的减少,相较而言此算法的计算复杂度也得到有效的降低。
其他文献
我国先后在不同地区建成了大量的风电场,双馈异步发电机(DFIG)在大量风电场中得到了广泛的应用。大多风电场和负荷中心的距离较远,因此串联电容补偿技术作为远距离传输一种手段,解决了风电场的大规模向外输送功率,但也会存在次同步振荡问题。本文针对含有双馈异步发电机组的风电场向外传输电能时,可能引起的次同步振荡现象,进行了深入的分析,主要内容如下: (1)对含双馈风电机组风电场经串联电容补偿技术向外输送电
目前,在我国大中型城市中,主要的能源供应形式是电能和天然气。除用于居民日常生活外,天然气被广泛地用于大型公用事业和服务行业。随着“西气东输”工程的逐步推进,天然气作为一种稳定的、相对清洁的能源形式将在一段时期内,在优化城市能源结构、发展高效低碳经济中发挥不可替代的作用。在城市天然气能源的利用方式中,冷热电联供系统(Combined Cooling Heating and Power,简称CCHP)
模拟振动测试的主要目的是用来检验产品在模拟真实的振动环境下能否保持其原有的稳定性能,在恶劣的振动环境下能否保持其原有的结构可靠性或者保持其原有的操作可靠性。这种模
《计算机组成原理》是计算机专业的一门核心课程,该课程涉及学科知识较多,需要硬件,软件,数字电路,程序设计方法学等课程的支撑,让学生们参与课程实验是学好这门课程的一个非常有效
在电力能源消费和新能源发电等系统中,以逆变器为核心的能量变换装置对于保证能量的顺利流动以及实现高品质的电能供应具有重要的作用。为了满足人们对电能质量和利用效率越来越高的要求,新的逆变器拓扑结构和控制方法被不断提出和研究。三电平逆变器因其具有更低的输出谐波、更高的转换效率等优点成为了研究和应用的热点。与此同时,模型预测控制(Model Predictive Control,MPC)方法被公认为是逆变
风速时间序列的预测研究广泛应用于风电并网、气象监测等许多领域,目前的风速预测误差较大,一般在20-30%之间,不能够满足实际需求。因此,风速时间序列的预测研究仍然是当前研
随着人类社会的不断发展,各行各业对能源的需求量越来越多。而目前我们使用最多的能源是化石能源,这种能源是不可再生能源的,在燃烧的过程中产生废气污染环境。在这样的大环境下,人们开始寻找清洁的、可再生的新能源。光伏发电由于光能的无穷性和整个系统在发电的过程中不会产生废气、废水污染环境从而得到了人类的广泛关注。本文主要是对光伏单相并网系统进行研究,具体内容如下。首先,对全球光伏产业的发展情况进行了调研,分
图像拼接技术就是将有重叠部分的图像(可能不同时间、不同视角或者不同传感器获得的)拼成一幅大型的无缝高分辨率图像的技术。图像配准和图像融合是图像拼接的两个关键技
随着科技的进步和人们生活水平的提高,身心健康成为当今社会的关注问题。通常,研究者可以通过社交感知特征客观分析和评估身心健康状态。语音信号处理是该领域重要的研究方向
煤矿瓦斯灾害是制约矿井安全生产的主要自然灾害之一,严重影响着工人的生命及财产安全,因此认识瓦斯灾害发生的规律和特征、实现瓦斯涌出量的准确预测是防治瓦斯灾害的有效手段