基于自适应数据剪辑策略的Tri—training算法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:YOYO654321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Tri—training能有效利用无标记样例提高泛化能力.针对Tri—training迭代中无标记样例常被错误标记而形成训练集噪声,导致性能不稳定的缺点,文中提出ADE-Tri—training(Tri—trainingwithAdaptiveDataEditing)新算法.它不仅利用RemoveOnly剪辑操作对每次迭代可能产生的误标记样例识别并移除,更重要的是采用自适应策略来确定RemoveOnly触发与抑制的恰当时机.文中证明,PAC理论下自适应策略中一系列判别充分条件可同时确保新训练集规模迭代增大
其他文献
首先通过讨论时态XML查询数据模型TXQDM,提出了基于结点有效时间的前缀编码方案.以此为基础,引入TXQDM结点间的基于时态连通的等价关系和基于时态包含的拟序关系,建立了时态X
从微分几何角度考察与参数化形式无关的统计模型流形的固有复杂度,指出模型流形的Gauss-Kroneker曲率可以完全刻画模型流形在一点处的全部性质,进而分析了曲率与体积的关系;
在分析了目前一些典型的社区发现算法的基础上,通过对无主题条件下的隐含社区发现算法的研究,提出将基于流的社区特征和马尔可夫图形聚类算法(MCL)的簇结合起来寻找Web隐含社区
优化网络资源利用是Internet流量工程的重要目标之一.最小冲突路由机制通过利用多协议标记交换(MPLS)网络中的源-目的(SD)节点对信息,在为业务流请求选择标记交换路径(LSP)时,尽可