基于高频词汇的英文文本可视化

来源 :现代情报 | 被引量 : 0次 | 上传用户:wanglaow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为探索高频词汇间上下文关系的远近,本文研究了一种基于英文文本中高频词汇的可视化算法流程,并进行了可视化实现。我们首先用统计算法从英文文本中抽取出高频词汇及词汇间的上下文,然后定义了3种词汇间的连接方式,计算出有上下文关系的词汇间的关系度,并通过k-means算法对词汇间的关系度进行聚类,以体现出词汇间关系的远近,最后利用放射状树布局对聚类结果进行可视化。通过这种可视化形式,我们能够快速理解英文文本的内容。
其他文献
近年来,随着部门预算、非税收入管理、国库集中支付等一系列财政管理改革的深入,“小金库”设立形式发生重大转变,以会议费、培训费、劳务费为代表的单位公用经费虚列支出私设“
文章基于代理成本和企业发展战略两个方面,分析现阶段经济增加值披露适用范围,指出现阶段不是每一个企业都适合披露经济增加值信息,并讨论了经济增加值信息披露的列示。
各种新会计理念对新准则中利润表列报产生了较大影响。文章依照新的会计理念,借鉴国际财务报告准则与美国会计准则,参考当前IASB与FASB关于财务报表列报的研究新动向,结合我国国