论文部分内容阅读
数据挖掘(Data Mining)是近十几年中迅速发展起来的交叉学科,它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术,搭建了上述理论研究与实际应用间连接的桥梁。因其所涉及的知识领域众多、应用范围广泛,数据挖掘已成为最为研究人员和商业组织所关注的领域之一。当前数据挖掘的最大研究热点之一是WEB 挖掘,来自INTERNET 的各类数据和需求对数据挖掘提出了新的挑战,也为数据挖掘技术拓展了新的研究平台。网上智能(Web Intelligence)是一个新的研究方向,它集成了人工智能和信息技术领域最新的成果,大大强调了智能手段在互联网上的应用,数据挖掘技术在网上智能的研究中有着很重要的地位。基于网络的智能系统研究是WEB 挖掘和网上智能的重要研究方向,而智能推荐系统(Intelligent Recommendation System)又是网上智能系统的典型应用。随着互联网上信息的不断增长,人们不愿在信息的搜索和辨别上浪费时间而将自身迷失在数据的海洋当中,因此希望有一种友好而实用的方式帮助解决类似的问题,这为智能推荐系统的发展提供了机遇。本文重点研究了贝叶斯网(Bayesian Network)的学习、推理算法,实现了一个基于条件独立方法的贝叶斯网学习算法和基于随机概率的推理算法,并对其学习和推理效果进行了比较和分析。以贝叶斯网为模型,文中设计和实现了一个网上智能推荐系统—PIR系统(Personalized Intelligent Recommendation System),并将其扩充为一个开放性的智能推荐系统框架,在PIR 系统框架上可以方便的扩充新的推荐算法,并将其快速集成到现有的电子商务或数字图书馆等应用系统当中。本文是这样安排的:首先对数据挖掘技术进行了综述,介绍了数据挖掘的基本概念及其主要算法,给出了数据库中知识发现的主要过程和步骤。之后阐述了智能推荐系统产生的必要性,详细讨论了智能推荐系统在电子商务和数字图书馆系统当中的应用,总结了当前比较有代表性的各种智能推荐算法,并给出了对智能推荐算法的有效评价方法。本文对贝叶斯网络进行了综述,介绍了