PU学习相关论文
冰雹灾害是一种由强对流风暴引发的灾害性天气现象,通常会破坏农作物和建筑,造成巨大经济损失。尽管冰雹研究已经取得不小进展,但......
正类和无标签类学习(Positive and Unlabeled learning,PU学习)作为弱监督学习领域中不完全监督的一个重要分支,由于其在实际应用中......
传统的监督机器学习分类方法需要对大量的准确标注数据进行训练来保证其效果。但是,在许多现实应用中,获取大量准确标注的数据需要......
近些年来,机器学习成为一个热门的学科,涉及人类生活的各个方面。其研究目的是从已有的经验或数据中提取、总结出一定的规律,设计......
学位
图数据是一种由顶点和边构成的抽象的数据结构。随着信息科学技术时代的发展,研究人员发现图数据有强大的表示能力,可以对许多不同......
正标记和未标记学习(Positive and unlabeled learning,PU学习)的研究是为了解决只有正标记样本和未标记样本可用的问题。以前针对该......
本文提出了一种建议评论分类方法和一种建议关键短语提取方法,以实现评论文本的建议挖掘,帮助用户更便捷地作出决策,也帮助商家更......
在很多分类场景中,已标记的负例样本难以获取甚至不能获取。因此,仅使用已标记正例样本和未标记样本训练分类器的PU学习受到了广泛......
链接预测是根据网络中已知的结构,对其中缺失的链接进行预测。链接预测作为网络数据分析的重要研究内容,在探究网络演化规律、数据......
数据流是大数据时代的典型代表,具有连续、单遍扫描、快速变化和海量无穷等特点,数据的不确定性是现实应用中数据广泛具有的属性,......
随着以互联网为代表的网络信息技术的迅速发展,人们获得了多种多样的复杂网络数据。链接预测作为复杂网络数据分析和挖掘的重要问......
入侵检测是网络安全中的重要工作。近年来,随着攻击手段的发展,对网站入侵检测技术和方法提出了更高的要求。Web入侵检测技术主要......
软件克隆检测致力于找出两段功能相似的代码段,其对软件系统的维护和发展起着非常重要的作用。目前该领域存在很多研究试图有效检......
图像分类和识别任务一直是机器学习领域的热门研究课题之一。而在图像分类任务中,基于卷积神经网络的深度学习方法取得了目前最优......
近年来,研究者为了从海量生物医学文献中快速有效地获取所需要的生物医学知识,使用文本挖掘技术已成为生物医学和生物信息学领域的......
目前绝大多数在PU学习场景下的学习算法都只能处理确定数据,然而在现实世界的许多应用中,如在传感器网络、市场分析和医学诊断等领......
半监督学习是指利用大量“廉价”的未标记样本来辅助少量“代价高昂”的有标记样本学习的过程。正例无标记(Positive and Unlabele......
一个算法的二元分类器构建通常包含两个集合样例,其中一组为正例样本,另一组为负例样本。实际上,我们使用的很多生物数据库,如磷酸......
入侵检测问题可以模型化为数据流分类问题,传统的数据流分类算法需要标注大量的训练样本,代价昂贵,降低了相关算法的实用性.在PU学......
随着信息化的发展,工业控制系统面临严重的安全威胁,提出一种基于PU学习的工业控制系统异常检测方法。该方法通过状态表示将状态变......
近年来,随着数据科学研究的不断深入,异常检测作为数据科学中的一个重要分支受到了更加广泛的关注。异常检测是一种在大批量样本中......
建议挖掘作为一项新兴研究任务,具有重要的应用价值。针对传统建议语句分类方法所存在的规则复杂、标注工作量大、特征维度高、数......
为解决从大规模网络文本中快速、准确识别食品安全事件并进行实体关系抽取受中文复杂语法特性限制的问题,提出一种基于依存分析的......
识别虚假评论有着重要的理论意义与现实价值.先前工作集中于启发式策略和传统的全监督学习算法.最近研究表明:人类无法通过先验知识......
期刊
药物研发是一项耗资巨大、周期漫长、风险度高且成功率低的系统工程。据统计,新药研发从确定思路到投入市场需花费10-15年的时间、......
在正例和无标记样本增量学习中,初始正例样本较少且不同类别正例的反例获取困难,使分类器的分类和泛化能力不强,为解决上述问题,提出一......
随着World Wide Web的迅猛发展,Web信息呈现出爆炸式指数级涌现,催生了搜索引擎这一激动人心的研究领域。各种搜索引擎已经成为人......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
互联网的飞速发展产生了"信息过载"问题,新闻数量的爆炸性增长使得读者受到"信息迷航"问题的困扰。为解决这一问题新闻推荐系统应......
随着人类基因组计划的完成和后基因组时代的到来,测序技术为生物学研究积累了大量的可挖掘数据。根据分子生物学中心法则,遗传信息......
随着互联网的快速发展,网络已成为主流信息的载体。在海量信息中,文本是信息的主要表达形式,文本数据中包含大量丰富的知识,因此对文本......
通过协议特征对联网终端进行远程的类型推断、厂商与型号的有效识别,是实现网络安全测评的重要基础。以识别和推断联网设备的类型为......
随着互联网和电子商务的快速发展,越来越多的人选择在网上购买商品或者服务。在市场竞争白热化的情况下,商家需要及时发现消费者对......