论文部分内容阅读
多示例学习(Multi-Instance Learning)是一种监督学习框架,由于其对于复杂学习对象的出色表达能力,受到了很多研究者的关注。近年来多示例学习在方法、理论研究方面都有很多进展,并已被广泛应用于图像分类、视频标注、网页分类、基因表达模式分析等现实任务中。以往的多示例学习研究通常假设训练样本和测试样本来自相同的分布,然而在现实任务中,训练样本和测试样本的分布往往会有所不同。如何在样本分布变化的情况下进行有效的多示例学习,是一个有待研究的问题。本文对样本分布变化的多示例学习方法进行研究,主要做了以下工作:(1)提出了一种能在样本分布变化的情况下有效进行多示例学习的MICS方法。该方法通过探索包中示例间的关系,从包和示例两层面着手进行分布偏移补偿,实验验证了MICS方法的有效性。(2)对包中示例间的关系对多示例学习复杂度的影响进行了理论分析。结果表明,考虑包中示例关系时,多示例学习样本复杂度与最大包所含示例数呈对数相关。