论文部分内容阅读
随着当代资讯的不断发展,人们获得的信息量与数据量都有极大的增长,同时也使不同领域的信息量激增且共享要求不断提高。目前,已经存在很多针对数据集成的先进技术,取得了瞩目的成果。然而,如果涉及到存在大量分布松散的异构数据源,且这些数据源表达形式各异,尚没有成熟的技术或应用能够有效地解决该类别的海量异构数据集成问题。本文以海量异构数据系统为研究对象,设计并实现了针对海量异构数据进行有效集成的高效数据集成系统MassDIS来解决上述问题。主要研究工作包括以下几个方面:1.调查研究了国内外主要的数据集成方案,通过比较综述了主流数据集成方案的优缺点,并根据实际情况提出了解决本文所面临的具体问题的海量异构数据集成系统模型;2.调研了开发本海量异构数据集成系统所涉及的关键技术,针对实际情况有选择的对本系统所采用的关键技术进行深入研究;3.设计并实现了一种基于数据视图和人工神经网络的海量异构数据集成系统,该系统可以对终端用户提供统一的查询视图。系统的运行结果显示,本文中描述的海量异构数据集成系统在数据处理效率,数据吞吐量,扩展性,安全性,准确性以及用户界面友好性等方面都达到了较高水平。基本解决了海量异构数据集成中遇到的诸多难题,为海量异构数据源及数据的快速共享提供了一种新颖的解决思路。