论文部分内容阅读
互联网的快速发展和广泛应用,为人们提供了丰富全面的教育资源,极大的改变了人们的学习方式,促使越来越多的人们通过网络来施展教育和获得教育。然而网络教育资源数量的爆炸式增长,质量的参差不齐以及用户查找合适资源困难等问题成为网络教育进一步发展的瓶颈。互联网的发展不仅方便人们通过网络获取资源,而且促使人们即时发表相关评论来表达自己的观点、看法、需求和感受等。这些评论信息不仅对资源发布者极其重要,而且为用户选择资源提供了参考价值。因此,分析并抽取网络教育资源评论中的用户观点,并根据其倾向性分析结果对网络教育资源进行评价,具有较大的实用价值。 文本倾向性分析是实现上述研究的关键技术,即达到从用户表达的对某事物的评论文本中挖掘出蕴含的情感倾向等信息的目的。文本倾向性分析在网购产品评论分析、舆情监控及垃圾邮件过滤等领域均有着广泛的应用前景。 本文研究了文本倾向性分析和网络教育资源评价的相关理论,提出基于文本倾向性的教育资源评价,并将基于此方法实现的评价系统应用于数字出版支撑平台。本文所做的具体工作有:①研究了基于词语相似度的语义倾向判断算法,鉴于常用算法对评论观点词的褒贬倾向性识别效果不理想,对现有的词语语义相似度算法进行改进,使其在度量评论词语相似度时更为合理;②在独立考虑特殊义原“良”和“莠”以改进词语相似度的同时,考虑在词语极性判断中,与待估词语相似度接近的基准词的价值更高,进而优化了词语极性判断方法;③构建极性词典用于词语极性查找,根据依存关系提取程度副词或否定词以判断词语的上下文极性,并且给出了完成一条评论句的倾向性分析流程,主要包括句法分析、特征识别和观点提取、倾向性计算;④在以上研究的基础上对网络教育资源的评论信息进行倾向性分析,根据评论倾向性分析结果对网络教育资源进行评价,实现基于文本倾向性的网络教育资源评价,从而实现从用户角度出发的网络教育资源评价。针对上述四项工作,本文分别做了相应的实验,实验结果表明,改进后的方法在计算词语相似度时更为合理,并且判断词语倾向的准确率提高较大,评论句极性判断准确率在80%以上,基于文本倾向性的网络教育资源评价方法得出的评价结果更加合理全面,便于用户选择。