【摘 要】
:
数据仓库和数据挖掘是数据库研究、开发和应用最活跃的分支之一。数据挖掘指的是从大型的数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的,事先未知的潜在有用信息。
论文部分内容阅读
数据仓库和数据挖掘是数据库研究、开发和应用最活跃的分支之一。数据挖掘指的是从大型的数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的,事先未知的潜在有用信息。数据挖掘工具将为基于数据仓库的决策支持系统开发提供良好的技术支持,以发现数据仓库中潜在的知识。本课题将数据挖掘算法应用于智能答疑系统中,提出了一套基于数据挖掘算法的答疑设计方案并加以实现,目标是改正当前的汉语答疑系统中存在的一些缺点,实现一个高效快速准确的智能答疑系统。
本课题首先对数据仓库技术和数据挖掘技术进行了简要的回顾,在提出其基本概念的基础上,对数据仓库和数据挖掘的体系框架及运行过程也作了详细的探讨。为本文的全面展开奠定了基础。然后重点讨论了关联规则挖掘算法和文本聚粪算法,做了一定的改进,并将其用于答疑系统数据仓库设计中。其基本思想:将基于关键词的关联规则用于文档的相似度计算中,可以从每个问题所对应的许多答案中抽取出一个最优答案生成一个一一对应的问题答案对库。再执行基于关联规则的文本聚类算法,实现问题分类存储。将聚类后的每一类问题应用关联规则,可以得到更加准确的关联表,同时也促使相似度的精确度得以提高。经过以上工作便可以得到一个分类存储,答案准确度高的数据仓库。最后利用基于关键词关联度的相似度计算方法进行系统答疑,实现一个答疑准确的智能答疑系统。
经过多次试验证明,基于数据挖掘算法的智能答疑系统可以有效的提高系统答疑准确率,因实现了数据分类存储,因此在答疑的速率上也有了一定的提高。
其他文献
每次置身图书馆,面对书架上数百万册图书,都忍不住慨叹书海的浩瀚无涯,然而,能通过一本薄薄的《瓦尔登湖》结识大卫·梭罗,可以说是一生的幸运。《瓦尔登湖》是一本什么样的书呢?正如徐迟先生在《序言》中所说的那样:“《瓦尔登湖》是一本静静的书,一本寂寞的书,一本孤独的书,是一本寂寞、恬静、智慧的书。”可以说,《瓦尔登湖》是一本与急躁无缘的书,只适合在“寂寞和恬静”时静静阅读——如果你的心灵安静不下来,是无
据说闲游漫步是浪漫性情的体现,它可以帮助我们快速解读某个城市、某种文化抑或某种心情,并伴随着惊喜。漫步突尼斯的麦地纳老城,我最深刻的体会是:最本质的生活源于最淳朴的人民。 在阿拉伯语里“麦地纳(Medina)”是城市的意思,在位于北非的突尼斯市内有一处历经千年、保存完好的麦地纳旧城区,让你不仅可以体验北非的多元文化特征和阿拉伯的乡土气息,更能够享受到超级购物狂的乐趣。这里店铺鳞次栉比,商品琳琅满
在经济全球化、信息化浪潮的冲击下,任何地区要想取得经济发展,提高人民的生活水平,都必须要根据自己的实际情况,发展适合自己区域的产业行业。 近年来,随着新技术革命与产业结
19世纪末,当女性对将她们排除在政治、思想生活之外的传统观点发起挑战时,医学界和科学界专家往往以女人的性别弱点为根据,来论证男女不平等的必要性。著名美国女作家、艺术家夏洛特·博金斯·吉尔曼(1860—1935)曾经健康状况恶化,为此,医生禁止她继续从事自己的职业,然而,在她所写的惊悚恐怖的短篇小说《黄色壁纸》中,夏洛特极力拒斥这样的观点。《黄色壁纸》是对限制女性从事职业和抑制女性创造力的医学界和社
电子商务是借用信息网络技术为手段,进行商品交换的商务活动,是促进贸易发展、 实现贸易便利化的重要手段.目前,针对电子商务信任度缺失、 中心化程度高的问题,本文引入区块
基韦斯特是佛罗里达群岛最南的一个岛屿,位于迈阿密西南207公里,离古巴的哈瓦那只有170公里。基韦斯特的地理位置非常独特,它扼守着大西洋、墨西哥湾和加勒比海,从1822年开始肃清加勒比海盗开始,这里就成为了美国西海岸主要的海军基地。从地图上我们可以发现,迈阿密以南不是陆地,而是一系列的岛礁,形成一条长长的链条,从迈阿密南端一直延伸到基韦斯特,而基韦斯特是这一系列岛礁的最后一个岛屿,它离古巴首都哈瓦
当今时代全球化的速度令人惊叹不已,许多以前闻所未闻的事物不断出现在我们周围,让人目不暇接。但全球化并不是21世纪的专利,我们在日常生活中特别是在衣食方面早就享受全球化的成果了,那么你对此能有多少了解呢?来做几个选择题自我测试一下吧。1.第一杯咖啡是在哪儿制成的? a.巴西 b.也门 c,意大利2.谁让我们喝上了甘美的橘子汁? a.泰国人 b.墨西哥人 c.印尼人3.哪个国家打出了世界上的