【摘 要】
:
随着计算机技术,特别是数据库技术的快速发展和广泛应用,各行各业积累的数据量越来越大。传统的数据处理方式已很难充分利用蕴藏在这些数据中的有用知识,于是数据挖掘技术应
论文部分内容阅读
随着计算机技术,特别是数据库技术的快速发展和广泛应用,各行各业积累的数据量越来越大。传统的数据处理方式已很难充分利用蕴藏在这些数据中的有用知识,于是数据挖掘技术应运而生。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道、但又是潜在有用的信息和知识的过程。 专利信息集是目前世界上最大的技术信息集,几乎囊括了一切应用领域内的技术成果。日益激烈的商业竞争使企业越来越迫切的希望全面了解竞争对手的知识产权和将这些知识产权极大化的利用。运用数据挖掘技术对现有专利信息进行分析,以了解技术发展的生命周期或所处阶段、专利数据的地域分布与竞争对手的分布,可以减少重复研究和无效劳动,使投资行为更加合理主动。 本文重点探讨了运用数据挖掘手段描述专利信息的可行性。首先,作者介绍了本文所使用的专利信息分析与预测的数据挖掘基础技术。然后,以芯片封装技术领域专利为例,运用SQL 2000数据库进行了专利基础数据分析,并在Matlab平台上,使用自回归模型、广义神经网络模型和灰色模型,对所收集到的专利数据进行处理,分析年、月专利数据波动周期,预测下一时间段的申请量;利用文本挖掘技术,对关键词项进行频次分析,解析技术发展的一般规律;利用最近邻算法(k-nearest neighbors method,KNN)模型分类专利文档,提取近似专利以便进行人工解读。最后,在全文工作的基础上,设计“专利检索客户点题分析系统”编制方案,并给出其实现技术。
其他文献
随着我国对城市能源结构的调整,天然气将成为城市的主要能源之一。由于天然气供气负荷的波动,在用气高峰时需要对其进行调整,同时在天然气长输管线进行管道检修时需要备用气
研究背景与目的:动脉粥样硬化(AS)的发生机制存在多种假说,目前占主导地位的“损伤—反应假说”和“炎症说”认为,内皮细胞损伤、中膜平滑肌细胞迁移和增殖是AS发生的关键环
本文以上海市科学技术委员会“灾难防御评估系统关键技术的研究与应用”(课题编号:045115035)为背景,对信息系统的灾难恢复能力评估方法做出了深入的研究。具体来说,本文的主
电容角位移传感器是一种将机械角度的变化转换为电容量变化并给出相应电信号输出的测量装置,它具有非接触、高可靠性、灵敏度高、精度高和低功耗、结构简单、适应恶劣环境等
随着经济全球化的发展,人才成为企业保持竞争优势的最重要的资源。通过实施有效的继任计划管理,从而保障稳定和持续的人才供给,已经成为企业经营战略的重要组成部分。本研究
国家赔偿制度实施以来,取得了显著的法律效果和社会效果,但表现出一些立法中存在问题,一是国家作为赔偿主体的责任淡化;二是国家赔偿范围过窄,对于国家赔偿责任的免责情形规
中国股票市场是否已经达到弱式有效性一直是一个争议很大的问题。本文采用技术分析中常用的移动平均线工具这一角度,通过构造可变长度移动平均策略(Variable-Length Moving R
随着网络经济的飞速发展,网上银行在现代商业银行经营与发展中越发占居突出的地位。并且根据各项研究显示,服务质量已成为网上银行体现差异化和竞争优势的关键决定因素。鉴于
本文分三部分论述文化研究在中国20年的发展历程。 第一部分,首先回顾了文化研究在西方的兴起和兴盛的过程,接下来从外部社会文化环境和学术内部发展规律两个方面分析了文
网络成瘾是一种非物质依赖的行为成瘾,具有一些与其他成瘾行为类似的特征,如突显性、退瘾性、忍耐性和复发性等。已有研究主要集中在网络成瘾行为与个性特征的关系上,或探讨