贝叶斯网络研究

来源 :中国科学院研究生院(计算技术研究所) | 被引量 : 166次 | 上传用户:xuanguiqq110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络是研究不确定性问题的重要方法之一。它基于概率和统计理论,具有坚实的数学基础。由于具有自然的表达方式、强大的推理能力和方便的决策机制等许多优点,贝叶斯网络在许多领域得到了广泛的应用。本文在贝叶斯网络基础理论框架的基础上,主要研究了以下几个方面的内容:基于信息几何理论的贝叶斯网络研究、朴素贝叶斯分类器的提升、规则方法与贝叶斯网络结合文本信息抽取研究、层次贝叶斯网络文本分类器。本文的主要贡献如下:(1)分析了贝叶斯网络这一特殊类型的概率分布簇所对应的统计流形的特点:由于贝叶斯网络引入了条件独立性,从而降低了流形的维度,简化了统计流形上的Riemman度量矩阵。提出了基于信息几何理论的不完备数据条件下贝叶斯网络的参数学习算法:贝叶斯网络的自然梯度学习算法(NGBN)。推导出了离散型、连续型、条件Gaussian网、父节点连续而子节点离散等不同的贝叶斯网络类型其自然梯度的计算公式。通过理论分析和试验,说明了自然梯度学习比欧式梯度学习更合理,更快速。(2)提出了一种通过在原有属性的基础上重新构造属性集,从而提高属性间的条件独立性的方式来提高朴素贝叶斯分类器性能的新方法:基于Fisher分构建朴素贝叶斯分类器(FS-NBC)。新属性集的分量为贝叶斯网概率分布函数的对数对每个分布参数的偏微分。我们证明了在一定条件下,经过Fisher分映射后得到的新属性集是条件独立的,并从理论上分析了对于无先验信息的多项分布和原属性集已经是条件独立的情况下新属性集的独立性。试验表明该方法较好地提高了朴素贝叶斯分类器的性能。(3)提出了一种新的文本信息抽取算法:结合规则的动态贝叶斯信息抽取网(RDBIEN)。在半结构化文本抽取任务中,主要有两种技术手段:一种是基于规则的方法,另一种是基于概率的方法。基于规则的方法是处理确定性问题的重要手段,它具有充分吸取专家经验和更为直观、更易于获得的优点。而基于概率的方法则更鲁棒,性能更高。我们把规则方法与贝叶斯网络相结合,既保持了概率方法的鲁棒性等优点,又结合了规则方法在吸取专家经验等方面的优点。试验表明该算法具有较高的抽取性能。(4)提出了基于主题词树的贝叶斯文本层次分类算法。对于Web文本分类问题,存在文本的类别数太多、相对获得大量有标注的训练数据成本较高、特征维数太高从而使模型训练非常复杂等难点。本算法通过对同一主题词的子主题词的合并,有效地降低了文本特征词的维数,强化了关键维的作用。此算法不仅降低了训练的复杂度,而且有效提高了样本的质量,降低了噪声数据对分类的影响,从而可以在类别数太多而样本数相对较少的情况下获得较满意的分类精度。
其他文献
ERP(企业资源计划)是一个准确记录企业人、财、物等各项资源的轨迹,实现企业内部资源的共享和协同的系统。它集先进的信息技术和管理思想于一身,使企业内各业务流程无缝平滑地
本文在对目前远程监控系统可能采用的几种主要的通信方式的原理和特点进行比较的基础上,选择了GPRS作为远程监控系统中的通信方式,并以车辆定位信息远程传送模块和电力远程数
数学思想方法蕴含在数学知识的形成、发展以及应用的过程中,是数学发展的内在动力,是知识化为能力的桥梁,更是培养学生数学观念,促成创造思维的关键。以运用圆锥曲线的定义解
在强调法治和保障人权的当代民主社会,怎样保证司法权力的规范化运作,促进司法公正,是立法与执法两个层面都要考虑的问题。作为事后补救措施的刑事赔偿制度正是通过对国家刑事司
随着频率合成理论和高速大规模集成电路的发展,信号发生器作为一类重要的仪器,在通信、检测、导航等领域有着广泛的应用。特别是在高压电力系统的检测领域,常常需要模拟电网谐波
概念教学是数学教学的重要内容,而巩固与拓展概念教学则是提高教学质量的重要保证。教师应指导学生强化理解,抓住关键词、关键句帮助学生进行概念巩固;强化应用,在实际应用过程
<正>之前看到一篇文章,讲的是老外看中国人的休闲时间:太忙。无论中国人处于一个什么样的职位,总是工作忙碌,起早贪黑,周而复始,就算仅有的业余时间也会被各种烦琐事而挤兑。
目的探讨采用英国胸科协会改良肺炎评分(confusion,uremia,respiratory,BP,age 65 years,CURB-65评分)对慢性阻塞性肺疾病急性加重期(chronic obstructive pulmonary disease wi