基于决策树的非充盈态有标复句层次结构的构造方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:jk305
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语作为目前世界上使用人数最多的语言,语言学家对其的研究从未停止过。从最初的字处理、词处理,慢慢的向句处理、篇章处理转变,这既表明现在对于字、词处理的研究日趋成熟,也表明未来的研究重点慢慢的向句子和篇章发展。汉语复句作为连接单句和篇章的关键一环,已经成为目前中文信息处理的重要研究方向,也是研究难点之一。本文提出的利用机器学习中的决策树算法,从分句间的关联特征出发,以属性作为基础,确定两个分句是否属于同一类,将复句内层次分析问题转化为复句内分句分类问题,从而确定复句内的层次关系。本文的研究对象是非充盈态的有标复句,主要针对复句内的分句,前期对于复句的预处理就很重要。本文描述的预处理过程包括:首先对复句进行分词处理,找到复句中正确的关系词,这些关系词将是复句层次划分的重要依据。其次对复句内的分句进行处理,一方面利用标点符号的分割作用,对复句进行划分,初步得到复句内的分句,另一方面利用已有的规则库对这些划分出来的分句进行过滤,去掉伪分句,得到正确的分句。最后利用关系词对复句进行初步的层次划分,将无法确定层次的分句与其前后分句组合起来,组成相应的分句对,并提取分句对中所具有的分句间关联特征。预处理完成后,将收集到的分句对作为原始训练集,通过决策树算法,构成相应的决策树模型,这样就可以实现复句内分句的分类,从而提高复句层次结构的划分的正确率。实验结果表明,利用机器学习的决策树算法,构建相应的决策树模型,可以实现对复句层次结构的自动划分,正确率达到了 83.7%,这也说明了,该方法对非充盈态有标复句的层次结构划分是有效的。
其他文献
目的:探讨3.0T磁共振(MR)高分辨力T_2WI联合弥散加权成像(DWI)对直肠癌术前T分期的诊断价值以及DWI表观扩散系数(ADC)预测直肠癌病理分级、腺癌亚型的应用价值。方法:1.收集2017年6月至2020年9月在芜湖市第二人民医院手术治疗,术前均未经新辅助放化疗(CRT)治疗并接受3.0TMR高分辨T_2WI及DWI检查的直肠癌患者48例,其中男34例,女14例,平均年龄66.31±12
随着高速率无线通信技术的发展需求,无线频谱资源愈加紧张,而可见光通信技术利用LED灯作为信号发射器,可以同时实现照明和高速通信,因此受到了越来越多的关注。凭借着绿色环保、高速通信、无需频谱资源、安全可靠等优势,可见光通信的研究领域中出现了大量基于可见光通信和感知技术的应用设计,目前主要涉及室内定位、智慧交通、水下通信等方面,具有广阔的应用前景和研究价值。本文着眼于可见光通信和感知技术的室内应用,提
近年来,我国经济增速放缓,已由粗放的高速增长模式向高质量发展模式转变。产业结构升级、经济发展新旧动能转换,加快孕育新的市场机遇。与此同时,粗放增长模式下积累的风险隐患有所暴露,对银行业持续健康发展构成挑战。研究结果表明,商业银行的信贷结构与国民经济的发展之间存在相互影响的关系。一方面信贷结构的优化可以有效支撑国家经济建设与发展。通过信贷资源的优化升级,能够有效推动资本在不同产业之间进行流动,进而推
数字积分器和微分器作为一种重要的数字信号处理器件,在控制、生物工程、雷达、图像处理等方面有着重要应用。数字积分器和微分器同属数字滤波器。数字滤波器按照单位脉冲持
随着我国互联网技术的深入发展,互联网逐渐影响到了社会的各行各业,“互联网+”也成为了互联网发展的新形势。而科研作为国家创新驱动发展的核心,科研信息化的飞速发展虽然加
计算机技术的快速发展和人工智能的崛起,掀起了各个领域智能化热潮,智能设备逐渐进入到日常生活当中。计算机视觉作为计算机应用和人工智能等方面的重要分支,逐渐应用到图像
伴随着通信业和互联网业的发展,个人数字化信息和数据信息,长期处于高风险状态。自上世纪60年代以来,文本密码(数字字母所构成的密码)一直作为身份认证的主要方式,此后安全研究
作为一种新型的区域观测技术,无线多媒体传感器网络(WMSN)获得了国内外研究者的高度关注。在密集部署的无线多媒体传感器网络中,不同的相机节点所观察到的视觉信息存在较大的
本课题以猴头菌为材料,通过水提醇沉法提取猴头菌多糖(Hericium esrinaceus mixture polysaccharide,HEPM),氯磺酸-吡啶法进行硫酸化修饰,得到猴头菌硫酸化多糖(Hericium esrinaceus sulfate polysaccharide mixture,S-HEPM)。对其进行分离及纯化,确定硫酸基团的取代度,分析猴头菌硫酸化多糖的糖苷键、成分及单
在逆合成孔径雷达(ISAR)探测目标的阶段性过程中,假设目标沿某个轨迹作直线运动,那么可以等效为在这段时间内目标自身的一个平动加上围绕质心的一个非常小的转动,转动导致了