关联词约束的半监督文本分类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zxy6651
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种没有训练集情况下实现对未标注类别文本文档进行分类的问题。类关联词是与类主体相关、能反映类主体的单词或短语。利用类关联词提供的先验信息,形成文档分类的先验概率,然后组合利用朴素贝叶斯分类器和EM迭代算法,在半监督学习过程中加入分类约束条件,用类关联词来监督构造一个分类器,实现了对完全未标注类别文档的分类。实验结果证明,此方法能够以较高的准确率实现没有训练集情况下的文本分类问题,在类关联词约束下的分类准确率要高于没有约束情况下的分类准确率。
其他文献
数字水印是数字媒体版权保护的一种有效方法。提出了一种自适应的奇偶量化水印算法,其量化步长由Watson模型和JPEG量化表共同确定,并通过二者自适应地调节量化步长。水印在DCT
本文以个案研究探讨环球语言培训(Global LT)语言能力培训法。我们认为,基于语言能力的训练法,历经考验,是行之有效的语言培训法,在初始和分级阶段之间实行过渡训练作为桥接,学习更
一个恶意节点或一个妥协节点当选为簇头节点是基于簇的无线传感器网络要应对的最重要的问题之一。当恶意者进行一个重大的攻击行动时,个别节点可能易于被攻陷,因此要设计一种能
针对谷氨酸发酵过程一些关键参数不能在线测量而导致的建模精度不高的问题,Bagging和高斯过程回归算法相结合,提出一种基于Bagging算法集成高斯过程的软测量建模方法。该算法使用Bagging技术从训练样本集中选取若干子训练样本集,利用该若干子集形成许多高斯过程模型,并通过平均组合方式进行集成,得到最终的模型输出。将该集成算法应用到谷氨酸发酵过程的软测量建模中,实现了对谷氨酸浓度的准确预测,相对
近些年来,随着计算机基础教学任务的增多和课时的增加,机房承担的教学任务也在不断地加重,无疑给机房管理人员的管理和维护带来了很大的困难。本文根据我自己在西北大学现代学院
针对电磁环境三维体数据中提取出的多层等值面,根据交互绘制速率与绘制质量的不同要求,提出分层伪排序融合绘制方法和改进Depth Peeling融合绘制方法。前者实现了多层等值面的近似排序,采用逐像素着色增强边界轮廓,绘制速率快,适合需要快速绘制而质量要求不高的场合;后者通过引入Slicemap技术,解决了多层等值面片元分布不均匀的问题,并利用多遍绘制融合方法,提高了绘制复杂等值面的能力,从可视化效果
高等数学是中医药专业学生的重要基础理论课,是专业课程学习的基础,也是未来研究的必要工具,但其必须与中医药专业特色相结合。本文就中医药专业高等数学课程定位、课程内容、教
针对三维模型识别和检测问题,提出一种新的基于边缘特征的三维模型异常检测方法。将每一个三维模型利用边缘特征表示为一条时间序列,对产生的时间序列集进行Isodata聚类,利用聚类结果经过两次划分实现异常检测。第一次划分过程产生候选异常和候选正常,第二次划分过程在候选异常中进一步选出检测结果。实验结果表明,该算法性能优于传统的基于距离、邻近度以及基于相对密度的异常检测算法,在一定条件下,也优于基于密度的
目标的微运动所产生的微多普勒特征包含了目标的运动和结构信息,在目标的分类、识别等领域中有着重要的作用。建立了振动与加速运动的复合微动模型,定量分析了目标的微多普勒
碳通量(FC)作为全球二氧化碳循环与排放的重要指标,同各种生态因素有着密切的关系,因此可以通过各种生态因素预测碳通量,但迄今还缺乏有效的预测方法。研究脊波和神经网络结合