【摘 要】
:
在“便携式农业专家系统”项目的开发中,为了从农作物信息文本中抽取数据构造数据库,首先得从文本中为各类物种提取信息模板,形成数据库中各个表的字段定义。由于自然语言尤其是
论文部分内容阅读
在“便携式农业专家系统”项目的开发中,为了从农作物信息文本中抽取数据构造数据库,首先得从文本中为各类物种提取信息模板,形成数据库中各个表的字段定义。由于自然语言尤其是中文表示的灵活性,同一类信息的描述就有很多不同的表示,要从不同的描述中提取出各种信息模式,就需要对文本中的各个句子进行归类,而要通过计算机来解决这个问题,就必须采用聚类分析的方法。在聚类分析完成后,就可以将要抽取信息的句子与模板中的信息模式进行关键词匹配,定位它所属的的信息模式,最后抽取句子中的信息。聚类分析是一种应用性很强的数学方法,它已经应用到工程技术中的许多领域。在现实世界中,很多事物之间没有明显的划分界限,它们之间的关系往往是模糊的,普通的聚类分析方法难以担此重任。将模糊数学方法应用到聚类分析中,形成模糊聚类分析。模糊关系更能反映客观事物之间的联系。因此,模糊聚类分析更适合于现实世界中事物的分类。通用的聚类方法一般适合于简单对象的分类和有限对象的分类。而在我们的应用中,文本语料中包含的信息量特别大,通用的聚类方法不适合于我们的应用。为此我们在开发中提出了一种新的快速模糊聚类算法,它具有准线性的处理速度和较高的聚类精度。本文先介绍了本项目开发的背景情况,然后介绍了农作物信息自动提取的任务的提出和基本解决思路。在文章的主体部分讲述了如何应用聚类分析的方法解决样本的归类问题:首先介绍了常用聚类方法,并对它们的复杂度进行了简要分析。然后详细介绍了我们提出快速模糊聚类算法,并给出了实验数据。文章最后介绍在农作<WP=4>物信息文本中实现信息自动提取的思路。
其他文献
该系统主要实现了音视频的实时采集、压缩、发送、接收、解压缩和回放的功能.该系统以TCP/IP为基础,采用C/S结构,以校园网为基本运行环境,以VisualC++6.0为工具编程实现.它使
车辆监控导航系统是科学技术发展到一定阶段的必然产物,它的发展与空间定位技术(GPS)、地理信息系统(GIS)、无线通信技术、计算机技术和电子技术的快速发展是紧密相关的。车辆监控
三维游戏中虚拟角色的交互包括角色与环境(含与其它角色)以及角色与玩家之间的交互等。由于游戏中的人工智能技术和运动控制编辑技术日趋复杂,游戏开发者往往不得不花费巨大
论文的第一章阐述信息技术的发展和国民经济信息化的含义,提出了建立办公自动化系统的重要性和国内办公自动化的现状和发展趋势,简述了该论文的选题背景和组织结构,并给出了
“人工神经网络”(ARTIFICIALNEURALNETWORK)是一门是近年来再度兴起并得到迅速发展的前沿交叉学科,它是一种在对人脑组织结构和运行机制的认识理解基础之上模拟其结构和智能行
随着电脑技术的发展,其应用也越来越普遍,电脑游戏逐渐发展成为现代人们主要的休闲娱乐方式之一。粒子系统凭借其真实模拟不规则自然运动的特点,大量应用于游戏中的各种场景
该文首先介绍了企业配电自动化的概念、运地模式、发展现状及发展趋势,并在对国内外关于企业配电自动化系统的理论和实践成果研究的基础上,应用组件对象模型,采用组件化软件
数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员的决策.它维护着海量的数据,所支持的查询形式复杂,通常需要访问大量数据,而一
该课题利用RS485总线标准,用软件实现FF的两种通信:周期性通信和非周期性通信.主站查询活动设备状态表,与每个到达通信时间的站点进行周期性通信.各站点之间通过传递令牌进行
该文主要内容涉及模式识别和电子商务两个领域,结合指纹识别技术、数据库技术和一定的法学理论,构造了一套将传统的合同机制应用于电子商务的操作模式,可以有效提高在线交易