【摘 要】
:
随着数据库技术的逐渐成熟和计算机网络的迅速普及,人们采集数据的能力得到了极大的提高,导致全球范围的信息急剧膨胀,为了对这些海量信息的隐藏知识进行开发,数据挖掘技术应
论文部分内容阅读
随着数据库技术的逐渐成熟和计算机网络的迅速普及,人们采集数据的能力得到了极大的提高,导致全球范围的信息急剧膨胀,为了对这些海量信息的隐藏知识进行开发,数据挖掘技术应运而生。目前,数据挖掘技术愈来愈成熟,应用范围也日趋广阔,但是,在港口信息领域还缺乏专门的研究。伴随着我国经济的发展,我国港口的规模也不断扩大,货物吞吐量也跟随着急剧增长。在各大港口采取信息化运作的背景下,港口信息已经由以往的手工操作转化为目前依靠网络技术的自动化操作,并且已经积累了一定数量的信息。跟其它领域一样,港口信息中也蕴含着潜在的有价值的知识有待于发现,这些知识能够为企业良好经营和决策部门做出重要决策提供帮助,所以对数据挖掘技术在港口信息管理中应用的研究就成为了当务之急。本文是数据挖掘技术在港口信息管理系统领域的一个初步尝试,试图验证数据挖掘技术在这个领域中的可行性。首先,介绍了数据挖掘技术的基本原理与概念,以及数据挖掘的任务,方法和步骤。着重研究了关联规则挖掘技术,本文在原始Apriori算法的基础上进行了改进,在生成新的项集的同时,减小原始数据库的规模,降低了算法扫描数据库的次数,有效地提高了算法的效率。其次,介绍了本文的数据挖掘对象—航道养护费征稽管理系统的设计模型和数据库结构,讨论了基于信息管理系统的数据挖掘应用,并分析了在关系型数据库中进行数据挖掘的可能性以及方法。最后,论文按照数据挖掘的标准步骤,对数据库原始表依次进行了数据选取,数据清洗,数据转化,使其成为适合于数据挖掘的文本数据源。并用Apriori算法进行挖掘,输入最小支持度阈值和最小置信度阈值,输出所有的频繁项集和强关联规则。根据强关联规则,发现了隐藏在港口信息中的一些规律。
其他文献
新时期中国大陆的魏晋游仙诗研究成就斐然,学者们能更新观念,转换视角,采用新的方法,将宏观的整体研究与微观的个案研究相结合,探讨了游仙诗的发展、渊源、流变等问题,尤其在
目的:探讨脑结构非对称性与精神分裂症遗传易感性之间的关系。方法:对符合美国精神障碍诊断和统计手册第四版(Diagnostic and Statistical Manual of Mental Disorders,Fourt
随着我国旅游业的不断发展,旅游资料更多的需要被翻译成英文给外国游客使用。大部分的旅游翻译作品都是非常成功的,但其中也存在很多问题。这些问题多是由于忽视了中英文化差
汽车产业作为国家产业的支柱产业,对社会经济建设和科学技术发展有重要的推动作用。随着全球经济一体化日趋明显,市场竞争日益激烈,面对国外汽车巨头的进入,我国的汽车产业仍
<正>代谢综合征包括腹型肥胖、高脂血症及高密度脂蛋白胆固醇(HDL-L)低下、胰岛素抵抗和(或)葡萄糖耐量异常等。随着研究的深入,代谢综合征研究的内容愈来愈丰富,如脂肪肝、
学校负债应该考虑的首要问题是最大限度地避免可能发生的财务风险。有关方面应加强对教育财务风险的管理与控制,构建包括自有资金动用程度、其他资金占有程度、学校资产负债
调查结果显示:在对新课程与教材的适应、教学观念与教学行为、教学评价、学生学习方式等方面,新课程改革实验都取得了显著的成效,但也存在着城乡实验效果差异显著、小学与初
航运业是传统的高风险行业,对于航运企业来说,面临着内外两方面的风险。对企业实施风险管理,尤其是全面风险管理,已经成为很多管理者面临的首要问题。针对我国风险管理方法的
文本聚类是文本挖掘的一个重要分支,因其独特的知识发现功能而得到较为深入的研究。文本聚类算法已经在文档自动整理、检索结果的组织和数字图书馆服务等方面得到了广泛的应
近红外光谱技术(NIR)是一种高效快速的现代分析技术,它综合运用了计算机技术、光谱技术和化学计量学等多个学科的最新研究成果。自上世纪80年代以来,随着计算机技术和化学计量