论文部分内容阅读
近年来,新闻资讯呈现几何数量级的增长,特别是当金融热点新闻事件发生时,数千万级的金融新闻资讯推向用户,金融热点新闻事件从何而来,又是如何发展的。
首先,通过文献查询发现,目前主要是用时间片聚类的方法生成事件脉络图,按照金融热点新闻发布的时间,把一个事件的节点进行排列,根据实际情况再加入媒体来源和转载率进行过滤,预设的维度太少,新闻事件脉络图的质量差强人意。
然后,本文提出了新闻事件脉络图模型,加入了更多的维度,相匹配的权重更合理,生成的新闻事件脉络图更准确。新闻事件脉络图模型从以下10个维度:金融热点新闻发布的时间、传统媒体的来源、垂直自媒体号、视频自媒体号、点击率、分享率、评论数、收藏率、阅读完成率、负评率,分别匹配相应的权重,在实时的大数据池中经过一次初筛和两次精选,再经过人工编辑,生成新闻事件脉络图,用融媒体的方式立体呈现,将金融热点新闻事件的来龙去脉说清楚。这些决定金融热点新闻节点的因素和权重都是在生产实践中总结和完善的,同时也会根据金融热点新闻事件的复杂程度进行动态地调整,增加或者减少这些维度的权重,金融新闻热点事件的流量和口碑是检验模型的最好标准。
最后,以新冠肺炎事件对中国经济的巨大影响以及瑞幸咖啡造假事件为例,对比百度和微博搜索出来的数千万条结果,呈现的都是新闻事件的最新消息,质量良莠不齐且重复性很高,各家资讯平台的专题虽然是按新闻事件发展的时间顺序以及重要节点来制作,但用户对复杂的新闻事件还是摸不到头脑,缺乏贯穿事件发展的主线,新闻事件脉络图模型则从10个维度匹配相应的权重,从大数据中挖掘优质的新闻节点,再加上编辑的人工运营,新闻事件的来龙去脉一目了然,新闻的质量和准确性以及用户的阅读体验都得到了很大提高,在新闻导向上也有了很好的把握。
首先,通过文献查询发现,目前主要是用时间片聚类的方法生成事件脉络图,按照金融热点新闻发布的时间,把一个事件的节点进行排列,根据实际情况再加入媒体来源和转载率进行过滤,预设的维度太少,新闻事件脉络图的质量差强人意。
然后,本文提出了新闻事件脉络图模型,加入了更多的维度,相匹配的权重更合理,生成的新闻事件脉络图更准确。新闻事件脉络图模型从以下10个维度:金融热点新闻发布的时间、传统媒体的来源、垂直自媒体号、视频自媒体号、点击率、分享率、评论数、收藏率、阅读完成率、负评率,分别匹配相应的权重,在实时的大数据池中经过一次初筛和两次精选,再经过人工编辑,生成新闻事件脉络图,用融媒体的方式立体呈现,将金融热点新闻事件的来龙去脉说清楚。这些决定金融热点新闻节点的因素和权重都是在生产实践中总结和完善的,同时也会根据金融热点新闻事件的复杂程度进行动态地调整,增加或者减少这些维度的权重,金融新闻热点事件的流量和口碑是检验模型的最好标准。
最后,以新冠肺炎事件对中国经济的巨大影响以及瑞幸咖啡造假事件为例,对比百度和微博搜索出来的数千万条结果,呈现的都是新闻事件的最新消息,质量良莠不齐且重复性很高,各家资讯平台的专题虽然是按新闻事件发展的时间顺序以及重要节点来制作,但用户对复杂的新闻事件还是摸不到头脑,缺乏贯穿事件发展的主线,新闻事件脉络图模型则从10个维度匹配相应的权重,从大数据中挖掘优质的新闻节点,再加上编辑的人工运营,新闻事件的来龙去脉一目了然,新闻的质量和准确性以及用户的阅读体验都得到了很大提高,在新闻导向上也有了很好的把握。