论文部分内容阅读
新闻的情感信息对于金融领域具有重要参考价值,短新闻内容精炼,尤其是新闻快讯更能够反映重大的新闻。随着短新闻的传播载体从纸媒到互联网的改变,金融领域开始尝试将其情感信息以计算机可以理解的形式提供给具体业务场景使用。但目前缺乏金融新闻情感分析的数据集,从而缺乏相应的情感自动标注方法,而且现有的提供新闻情感信息的产品不能满足本系统的需求。因此需要构建系统,标注金融短新闻的情感信息,辅助金融短新闻分析员进行分析归纳。本文首先介绍了机器自动标注金融短新闻情感信息的理论基础;选择了内容更丰富的数据源进行金融短新闻情感分析数据集的构建,标注了带有情感倾向的金融短新闻,整理得到金融短新闻词典;利用关键词提取、命名实体识别等构建了金融新闻分类树,并进行了词典的补充。在此基础上,根据金融短新闻分析员、金融短新闻标注员的需求,进行了系统的用例分析、功能需求分析。接下来,根据需求分析进行了概要设计,对系统的数据更新、信息展示、人工标注三个模块进行了详细设计和实现。在数据更新模块的详细设计与实现中,介绍了新闻获取方法、情感倾向预标注方法、类别预标注方法。其中探索了金融短新闻情感倾向自动标注方法,对基于朴素贝叶斯算法和基于BERT两种方法进行了实验,最终选择了基于BERT的方法应用至金融短新闻情感倾向预标注。在人工标注模块中介绍了面向金融短新闻标注员的新闻查看、新闻标注功能的具体实现方法。在信息展示模块的详细设计与实现中,介绍了面向金融短新闻分析员的新闻及其情感倾向浏览、筛选与排序、数据统计展示的具体实现方法。最后,对系统进行了测试,设计了测试用例,展示了测试结果。