知识管理平台中的数据智能处理

被引量 : 0次 | 上传用户:longxue1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识资源作为现代经济时代企业发展的第一推动力,高效的知识管理成为提升企业竞争力的关键。文档智能处理作为知识管理平台中要实现的主要功能之一,对所收集的文档做分类及摘要处理,方便后续知识利用。同时,文档分类和摘要技术作为信息处理领域的关键技术,还可以应用在其他场合。现阶段文档分类技术主要利用机器学习的方法,通过学习生成分类模型,后期利用已生成的分类模型对文档进行分类。这种方法的弊端在于分类模型一旦建立,要更改分类体系就必须建立新的分类模型,代价过高。文档摘要的问题在于文摘质量的低完备性和高冗余性。针对这两个问题,本论文提出了一种基于特征词的文档分类方法和基于多特征的去除文摘冗余的方法。基于特征词的文档分类方法为分类体系中的每个类别提取一定数量的关键词,通过统计各个类别关键词的多少决定文档所属的类别信息。基于多特征的去除文摘冗余方法,首先根据位置、标题、关键词计算文档中语句的权值,然后根据词形、词序计算语句间的相似性。得到含有冗余因子的新的文档语句权值,然后选取适量语句作为文档摘要输出。试验结果表明,基于特征词的文档分类方法与一般采用的机器学习分类方法相比,拥有相同的召回率、准确率和F1指标,能够达到实际应用水平。文档自动摘要的结果易于阅读,容易理解。实验数据显示,自动文摘准确率较高,召回率略低。表明自动文摘的准确性较高,但是完备性有待提高。总的来说,自动文摘能较好的表达文章含义。
其他文献
谷崎润一郎与芥川龙之介同是日本大正时期颇具"支那趣味"的代表性作家,曾先后来到中国旅行。如果以谷崎和芥川的天津旅行为切入点对他们的文学表现与文化立场进行对比研究,可
目的观察津力达颗粒联合通心络胶囊治疗2型糖尿病肾病的临床疗效,探讨其作用机制。方法将120例2型糖尿病肾病Ⅲ期患者随机分为对照组和治疗组各60例,对照组予常规降糖、降压
"三农"问题一直以来就是阻碍湖南省经济持续发展的障碍,完备的农村金融体系是解决"三农"问题的基础。本文以湖南为研究对象,以第一产业GDP、农村金融相关率FIR、农村金融效率
A工程位于中山市,为一交易市场,首期占地500亩,建筑面积约8万平方米,附设四星标准酒店一座,商务中心一座,总投资为3.5亿元人民币,于2011年9月动工兴建。本文是研究在成本控制下的A工
随着我国经济的不断发展和可持续发展战略的需要,污水处理越来越受到社会的重视。将集散控制系统运用于污水处理厂可以增强系统运行稳定性,提高处理效率,节约能源,提高经济效
按少数民族人口在民族自治地方总人口中所占的比例分配自治机关中少数民族干部名额是民族自治地方干部民族化的科学内涵。把干部民族化完全等同于自治机关干部的自治民族化是
可逆式水泵水轮机广泛应用于抽水蓄能电站,与水轮机和水泵串联的蓄能机组相比,其体积、重量大大减小,造价降低,因而得到了广泛应用。由于国内对水泵水轮机的研究起步较晚,设计及试
电力行业是我国国民经济发展的重要能源产业之一,也是支撑社会进步的基础产业。2011年,我国已经超过美国,成为世界上第一大电力生产和消费国。我国以煤为主的资源禀赋决定了我国
9月2日,本刊编辑部在长春市与长春电影制片厂联合召开“发展有中国特色的社会主义电影艺术创作”座谈会。会议由本刊主编陈播和吉林省影协副主席赵子明主持,华克、李耿、张辉
工程项目中的索赔是工程项目管理的一个重要组成部分。长期以来,中国工程界由于受计划经济体制的约束,法律观念和合同意识比较淡薄。随着建筑业飞速发展的同时,索赔问题也频频出